Категории против тегов|Таксономия И Фолксономия
Раз уж я продолжаю играться в рядового Очевидность, давайте раз и навсегда разберемся с организацией контента. Конкретнее, с принципами упорядочивания больших и не очень объемов элементов содержимого (а в нашем случае — постов).

Ведь иногда (к счастью, все реже) можно услышать — «теги — фигня, я только категориями буду пользоваться», или «за тегами будущее, а все остальное — останется за бортом» и подобную чушь. Но подобное происходит лишь от недопонимания, как работать с этими двумя системами одновременно, да и вообще, что они из себя представляют.
Таксономия → Категории
Классическая схема — разбивка по категориям (они же разделы, папки, типы, рубрики), которая использовалась с самого начала в большинстве гипертекстовых страниц.
Таксономия (гр. расположение по порядку + закон) — иерархически выстроенная система целей и результатов от простой к сложной системе.
из Вики
Это позволяет четко видеть именно иерархию расположения страниц — от самого корня, до конретной страницы. Такой путь называют еще хлебными крошками. Удобство такой системы разделения в том, что каждая страница принадлежит ровно одному разделу, а сам раздел может быть «ребенком» также только одной категории (или корню, который в традиционных схемах статей содержать не может). Простота и логичность категоризации, думаю, понятна любому.
Ссылки на категории должны сопровождаться микроформатной разметкой — в теге <a> атрибут rel="category".
Однако, слишком большое количество информации, структурированной подобным образом, создает определенные сложности. Если разбиение на категории происходит по принципу глав в книге или по тематике, может произойти две вещи. Либо возникнет слишком много информации в каждом из разделов, чтобы они выполняли свою роль. Либо количество каталогов настолько увеличится, что даже иерархия вложенных каталогов сильно разрастется. А перегруженная иерархия — сама по себе враг пользователя, которая заставляет его делать больше шагов.
Фолксономия → Теги
Плюс добавьте себе невозможность на практике работать с такой иерархией целому сообществу человек — т.к. начинают плодиться дубликаты одних и тех же рубрик (коллективных бложеков). Вот почему с приходом мистерии-два-ноль и стали популярны теги.
Фолксономия (англ. folksonomy, от folk — народный + taxonomy — таксономия) — практика совместной категоризации информации (ссылок, фото, видео клипов) посредством произвольно выбираемых тегов.
из Вики
Вообще говоря, несмотря на происхождение от слова «народный», такая система разделения контента легко применяется и в случае одного пользователя системы — она идет в качестве дополнения к стандартным категориям. Это позволяет связывать контент еще эффективнее — мало того, что одна статья может принадлежать нескольким тегам, так еще статьи из одного тега могут принадлежать разным категориям. Т.е. теги — уточняют принадлежность страницы к конкретной самой узкой тематике. Причем это происходит также удобно, как при использовании «словарного указателя» в каком-нибудь справочнике — хаос легко упорядочивается.
Ссылки на теги должны сопровождаться микроформатной разметкой — в теге <a> атрибут rel="tag".
Теги + Категории
В блогах с небольшим количеством автором теги работают именно так — открывая возможность подсовывать читателю схожие статьи, найденные по тегам. В больших коллективных же теговая система опять же вызывает огромное количество дубликатов — что можно преодолеть использованием связывания самих тегов — с помощью синонимичности (разные написания — один и тот же смысл) или релятивности (связанность темы тегов — «html» и «css» часто употребляются рядом). В любом случае, такой метод работает пусть не идеально, но все же работает.
Как категории, так и теги можно выводить и для навигации вручную — от списков до «умных» облаков, в которых размер пункта увеличивается в зависимости от количества страниц или популярности (и не показываются совсем «куцые» теги). Тема «размещать-не размещать» сложнее, чем кажется, потому что надо, в первую очередь, исходить из наполненности проекта и роли его контента. А также удобства для обычного пользователя.
В общем и целом, обе системы действительно помогают использовать структуризацию на полную катушку. Сейчас даже теги вышли за пределы блогов, ворвавшись на обычные проекты, вплоть до информационных сайтов, что уж говорить о социально ориентированных сервисах. Вот только вся эта мощь зачастую улетает в никуда вследствие небрежного отношения с этими инструментами и недостатков пользовательских интерфейсов.
Вот пример — чертов Вордпресс позволяет мне использовать категории абсолютно так же, как теги. И смысл?





Категория может использоваться в URL, а тэг — нет. Помимо этого, категории являются иерархической классификацией, а тэги — плоской. Пожалуй, вся разница.
Так категории или теги? Что посоветуете? Я, честно говоря, уже настолько запутался в этом вопросе, что у меня теперь полная мешанина. Прихожу к такому выводу: категории отвечают за определенную линию или действие, например, «Я изучаю», а теги — это штампы принадлежности к какой-то узкой теме, например «Wordpress» или «Декорирование». Но тогда есть и обратная сторона медали — количество тегов разрастается с неимоверной скоростью. Блин, опять пришел к тому, с чего начал.
@tiaurus: Категории — иерархическая система, подходит для создания папочной, подтемной структуры с узкими «раскрытиями». Т.е. их использовать лучше для общих тем, которые раскрываются на блоге. Если надо, эту тему можно разбить на несколько подтем.
Как правильно сказал Владимир, теги — плоская классификация записи. Их необязательно даже выводить — можно использовать для определения «похожих записей», как в Simple Plugin.
А т.к. они разрастаются и для навигации не нужны, то никаких облаков тегов в сайдбарах — такая система нужна только для крупных проектов.
@Vladimir: Несколько категорий в URL? Ну, вообще бредово. Также как и отображение по умолчанию всех записей из дочерних категорий в родительской. Это если по смыслу брать.
Почему?
sitename.com/wordpress/
sitename.com/wordpress/themes/
sitename.com/wordpress/plugins/
Я даже где-то читал, что это хорошо для SEO — типа если пользователь ищет «plugin wordpress simpletags», то у /wordpress/plugin/simpletags больше шансов, чем у /simpletags. Судить не берусь, я не спец в этом.
А ведь это мысль! — не выводить теги вообще, а использовать их только для внутренних нужд (например, чтобы ссылаться на похожие посты с помощью Simple Tags).
@tiaurus: Ну, иногда для поиска ими пользуются. Так что хотя бы под постами можно. А можно и не можно.
@Vladimir: Порядок и морфология стали жестче в новых алгоритмах, да. Но, по-моему, в ссылке это учитывается мало как раз (она сама не так много приносит релевантности). Учитывается транслитерация, прямые синонимы (с русским языком ничего общего), аббревиатуры, даже перевод и пр. — почти все, что и к другим частям. Правда, огромные урлы отвратительны и не работают, на мой взгляд.
По поводу использования двух категорий на один пост — категорически считаю, что неправильно. Вот если аналогию проводить, то категория — это уникальное поле в БД или папка в файловой системе, а тег — это secondary key. Последнее можно использовать, естественно, только для навигации.
А вот в sitename.com/wordpress/themes/butterfly/ (или .html) получается, что themes — это вложение в wordpress, но никак не принадлежность к обеим. А то получается как в обещанной WinFS и sitename.com/wordpress/themes/butterfly/, и sitename.com/wordpress/butterfly/, и sitename.com/themes/butterfly/ — в случае УРЛов это плохо.
А разве нельзя привести УРЛ к каноническому виду и клеить разные формы одного и того же урла?
Подожди, а зачем?
Разные формы допустимы при навигации, поиске и т.д. Поисковики сейчас вполне нормально относятся к тому, что на bfm.ru или news2 можно выводить ленты по нескольким категориям одновременно, создавать кучу всяких лент.
Но — а смысл иметь у поста (это же логическая единица) пять написаний, если никто не пользуется ручным набиранием урла (даже американцы), особенно, на блогах. Максимум — редирект со «склеек» на один, главный пермалинк. И то, смысл, если на сайте везде ссылки на пермалинк, а не на варианты.