Категории против тегов|Таксономия И Фолксономия

Раз уж я продолжаю играться в рядового Очевидность, давайте раз и навсегда разберемся с организацией контента. Конкретнее, с принципами упорядочивания больших и не очень объемов элементов содержимого (а в нашем случае — постов).

Структурируем контент

Ведь иногда (к счастью, все реже) можно услышать — «теги — фигня, я только категориями буду пользоваться», или «за тегами будущее, а все остальное — останется за бортом» и подобную чушь. Но подобное происходит лишь от недопонимания, как работать с этими двумя системами одновременно, да и вообще, что они из себя представляют.

Таксономия → Категории

Классическая схема — разбивка по категориям (они же разделы, папки, типы, рубрики), которая использовалась с самого начала в большинстве гипертекстовых страниц.

Таксономия (гр. расположение по порядку + закон) — иерархически выстроенная система целей и результатов от простой к сложной системе.
из Вики

Это позволяет четко видеть именно иерархию расположения страниц — от самого корня, до конретной страницы. Такой путь называют еще хлебными крошками. Удобство такой системы разделения в том, что каждая страница принадлежит ровно одному разделу, а сам раздел может быть «ребенком» также только одной категории (или корню, который в традиционных схемах статей содержать не может). Простота и логичность категоризации, думаю, понятна любому.

Ссылки на категории должны сопровождаться микроформатной разметкой — в теге <a> атрибут rel="category".

Однако, слишком большое количество информации, структурированной подобным образом, создает определенные сложности. Если разбиение на категории происходит по принципу глав в книге или по тематике, может произойти две вещи. Либо возникнет слишком много информации в каждом из разделов, чтобы они выполняли свою роль. Либо количество каталогов настолько увеличится, что даже иерархия вложенных каталогов сильно разрастется. А перегруженная иерархия — сама по себе враг пользователя, которая заставляет его делать больше шагов.

Фолксономия → Теги

Плюс добавьте себе невозможность на практике работать с такой иерархией целому сообществу человек — т.к. начинают плодиться дубликаты одних и тех же рубрик (коллективных бложеков). Вот почему с приходом мистерии-два-ноль и стали популярны теги.

Фолксономия (англ. folksonomy, от folk — народный + taxonomy — таксономия) — практика совместной категоризации информации (ссылок, фото, видео клипов) посредством произвольно выбираемых тегов.
из Вики

Вообще говоря, несмотря на происхождение от слова «народный», такая система разделения контента легко применяется и в случае одного пользователя системы — она идет в качестве дополнения к стандартным категориям. Это позволяет связывать контент еще эффективнее — мало того, что одна статья может принадлежать нескольким тегам, так еще статьи из одного тега могут принадлежать разным категориям. Т.е. теги — уточняют принадлежность страницы к конкретной самой узкой тематике. Причем это происходит также удобно, как при использовании «словарного указателя» в каком-нибудь справочнике — хаос легко упорядочивается.

Ссылки на теги должны сопровождаться микроформатной разметкой — в теге <a> атрибут rel="tag".

Теги + Категории

В блогах с небольшим количеством автором теги работают именно так — открывая возможность подсовывать читателю схожие статьи, найденные по тегам. В больших коллективных же теговая система опять же вызывает огромное количество дубликатов — что можно преодолеть использованием связывания самих тегов — с помощью синонимичности (разные написания — один и тот же смысл) или релятивности (связанность темы тегов — «html» и «css» часто употребляются рядом). В любом случае, такой метод работает пусть не идеально, но все же работает.

Как категории, так и теги можно выводить и для навигации вручную — от списков до «умных» облаков, в которых размер пункта увеличивается в зависимости от количества страниц или популярности (и не показываются совсем «куцые» теги). Тема «размещать-не размещать» сложнее, чем кажется, потому что надо, в первую очередь, исходить из наполненности проекта и роли его контента. А также удобства для обычного пользователя.

В общем и целом, обе системы действительно помогают использовать структуризацию на полную катушку. Сейчас даже теги вышли за пределы блогов, ворвавшись на обычные проекты, вплоть до информационных сайтов, что уж говорить о социально ориентированных сервисах. Вот только вся эта мощь зачастую улетает в никуда вследствие небрежного отношения с этими инструментами и недостатков пользовательских интерфейсов.

Вот пример — чертов Вордпресс позволяет мне использовать категории абсолютно так же, как теги. И смысл?

Тегокаталоги
{8 комментариев} Подписка на комментарии

> Вордпресс позволяет мне использовать категории абсолютно так же, как теги. И смысл?

Категория может использоваться в URL, а тэг — нет. Помимо этого, категории являются иерархической классификацией, а тэги — плоской. Пожалуй, вся разница.

Так категории или теги? Что посоветуете? Я, честно говоря, уже настолько запутался в этом вопросе, что у меня теперь полная мешанина. Прихожу к такому выводу: категории отвечают за определенную линию или действие, например, «Я изучаю», а теги — это штампы принадлежности к какой-то узкой теме, например «Wordpress» или «Декорирование». Но тогда есть и обратная сторона медали — количество тегов разрастается с неимоверной скоростью. Блин, опять пришел к тому, с чего начал.

@tiaurus: Категории — иерархическая система, подходит для создания папочной, подтемной структуры с узкими «раскрытиями». Т.е. их использовать лучше для общих тем, которые раскрываются на блоге. Если надо, эту тему можно разбить на несколько подтем.

Как правильно сказал Владимир, теги — плоская классификация записи. Их необязательно даже выводить — можно использовать для определения «похожих записей», как в Simple Plugin.

А т.к. они разрастаются и для навигации не нужны, то никаких облаков тегов в сайдбарах — такая система нужна только для крупных проектов.

@Vladimir: Несколько категорий в URL? Ну, вообще бредово. Также как и отображение по умолчанию всех записей из дочерних категорий в родительской. Это если по смыслу брать.

Почему?

sitename.com/wordpress/

sitename.com/wordpress/themes/

sitename.com/wordpress/plugins/

Я даже где-то читал, что это хорошо для SEO — типа если пользователь ищет «plugin wordpress simpletags», то у /wordpress/plugin/simpletags больше шансов, чем у /simpletags. Судить не берусь, я не спец в этом.

А ведь это мысль! — не выводить теги вообще, а использовать их только для внутренних нужд (например, чтобы ссылаться на похожие посты с помощью Simple Tags).

@tiaurus: Ну, иногда для поиска ими пользуются. Так что хотя бы под постами можно. А можно и не можно.

@Vladimir: Порядок и морфология стали жестче в новых алгоритмах, да. Но, по-моему, в ссылке это учитывается мало как раз (она сама не так много приносит релевантности). Учитывается транслитерация, прямые синонимы (с русским языком ничего общего), аббревиатуры, даже перевод и пр. — почти все, что и к другим частям. Правда, огромные урлы отвратительны и не работают, на мой взгляд.

По поводу использования двух категорий на один пост — категорически считаю, что неправильно. Вот если аналогию проводить, то категория — это уникальное поле в БД или папка в файловой системе, а тег — это secondary key. Последнее можно использовать, естественно, только для навигации.

А вот в sitename.com/wordpress/themes/butterfly/ (или .html) получается, что themes — это вложение в wordpress, но никак не принадлежность к обеим. А то получается как в обещанной WinFS и sitename.com/wordpress/themes/butterfly/, и sitename.com/wordpress/butterfly/, и sitename.com/themes/butterfly/ — в случае УРЛов это плохо.

А разве нельзя привести УРЛ к каноническому виду и клеить разные формы одного и того же урла?

Подожди, а зачем?

Разные формы допустимы при навигации, поиске и т.д. Поисковики сейчас вполне нормально относятся к тому, что на bfm.ru или news2 можно выводить ленты по нескольким категориям одновременно, создавать кучу всяких лент.

Но — а смысл иметь у поста (это же логическая единица) пять написаний, если никто не пользуется ручным набиранием урла (даже американцы), особенно, на блогах. Максимум — редирект со «склеек» на один, главный пермалинк. И то, смысл, если на сайте везде ссылки на пермалинк, а не на варианты.

А здесь можно оставить свое мнение ↓ Подписка на комментарии
какие-то из следующих трех полей можно оставить пустыми


нет тегам!!! **эмоция**, __ирония__, >цитата, {[код]}