RuData: Категоризация
| ||
---|---|---|
Тематические статьи | ||
Техническая справка | ||
Общие правила | ||
Категоризация — это процесс классификации статей по темам.
Для простоты понимания, можно сказать, что Категория - это раздел в базе данных RuData.
Категории (наряду со списками, обзорными шаблонами и др.) помогают читателям находить информацию, даже в тех случаях, когда они не знают, как искомая тема называется, или сомневаются в том, что она вообще присутствует в РуДате. Сами категории внешне представляют из себя оглавления, внутри которых их содержание (то есть статьи, включённые в эту категорию) отсортировано по алфавиту.
Самой главной, «корневой» категорией является Категория:Всё.
Добавление статьи в категорию
Статья из любого пространства имён может быть включена в любую категорию путём добавления тега-ссылки на страницу категории, образованного добавлением к имени категории ключевого слова Категория:, например:
[[Категория:Имя категории]]
Это соответствует ссылке на соответствующую страницу категории, располагающуюся в пространстве имён категорий. Таким образом, если Вы пишете статью о российском актёре, то добавив в конце своей статьи категорию [[Категория:Актёры России]], Вы автоматически поместите вашу статью в список «Актёры России».
Страница может быть внесена больше чем в одну категорию — нужно просто добавить несколько тегов. При просмотре отредактированной страницы эти ссылки отображаются не в основном тексте, а на полях страницы, в позиции, жёстко заданной используемым скином (внизу при использовании Monobook, справа вверху — при использовании Standart). В противоположность автоматической сортировке списков категорий (см. ниже), список категорий на странице располагается в порядке следования соответствующих тегов.
Изображение добавляется в категорию при внесении её страницы описания.
Общие положения
Категории как один из ключевых способов организации информации в РуДате следует добавлять ко всем типам страниц, которые представлены в РуДате, но при этом есть некоторые ограничения по форме и обьёму категоризации.
Для статей
Статьи являются основным продуктом работы РуДаты, и грамотная категоризация очень важна для них. Наличие хотя бы одной категории в статье обязательно, по нескольким причинам: во-первых, это чуть ли не единственный способ найти информацию, не зная, как называется искомая статья, во-вторых, это значительно ускоряет внесение статьи в индекс поисковых систем, что опять увеличивает доступность статьи для читателей, ну и в-третьих, категоризация сама по себе — очень удобный способ структурирования информации.
При этом есть определенные ограничения на количество категорий, в которые может быть внесена статья. Следует использовать наиболее конкретные категории. Если статья подходит по смыслу для категории А и её подкатегории Б, то её, как правило, следует включать только в Б. Исключением может быть тот случай, когда статья значима и для всей категории А (как правило, это обзорные статьи). То есть если Вы внесли статью о российском актёре в Категория:Актёры России, то не стоит её вносить и в категорию Категория:Актёры, так как категория «Актёры России» уже явлется подкатегорией более глобальной категории «Актёры».
Страница категории
Страница категории содержит текст описания, который может быть отредактирован так же, как и любая другая страница; однако при просмотре страницы на ней также отображаются автоматически создаваемые, упорядоченные по алфавиту списки ссылок на все присутствующие в ней страницы и подкатегории.
Полный список категорий русской РуДате находится здесь: Служебная:Categories.
Новые категории могут быть созданы и исправлены так же, как и обычные страницы, однако при просмотре к ним в конец будут добавлены автоматически создаваемые списки.
Вы можете внести страницу в категорию путём добавления «[[Категория:Имя категории]]» в её исходный текст.
Страница категории содержит:
- текст описания, который может быть отредактирован;
- список подкатегорий и их количество; если подкатегории отсутствуют, то данный раздел не отображается;
- список страниц, включенных в данную категорию, кроме подкатегорий и изображений; их количество, называемое «числом статей»; если категория пуста, то отображается заголовок и строка «Категория пуста»
- список изображений с картинками предпросмотра (подсчёт количества не ведётся); если имя изображения длиннее 20 символов, оно обрезается и дополняется троеточием; в отличие от второй и третьей секции, рубрикации по первым буквам имени не происходит; также отсутствует подзаголовок, отделяющий этот раздел от раздела статей.
Данные списки содержат только ссылки на соответствующие страницы, для изображений даётся также ссылка на страницу описания.
В РуДате при перенаправлении на страницу категории отображается только текст описания категории; чтобы избежать этого и получить полную страницу после перенаправления, используйте ссылки «Image» и «Category», соответственно.
Для подкатегорий
Если страница, внесённая в категорию, сама является категорией, она образует подкатегорию.
Например, вы можете редактировать Категория:Футбол и добавить в неё ссылку на Категория:Спорт. Категория «Футбол» станет подкатегорией категории «Спорт».
Если для статей основополагающее правило «если что-то существенное в статье относится к теме такой-то категории, то статью следует поставить в эту категорию», то для подкатегорий правила несколько иные.
Подкатегории следует подбирать так, чтобы во всём дереве каждой категории не было ни одной статьи, которая к ней не относится. Таким образом, категория А может стать подкатегорией в категории Б только в том случае, если все её статьи и подкатегории всех уровней не выходят за рамки категории Б.
Возможна ситуация, когда две категории пересекаются, имеют общую область. В таких случаях бывает удобно создать категорию, объединяющую область их наложения. Например, Категория:Генетика и Категория:Медицина могут иметь много общих статей, но нельзя помещать ни одну из них в другую. Вместо этого логично создать Категория:Медицинская генетика, которую поместить в обе исходные категории, и все статьи из пересекающихся областей помещать в эту гибридную категорию.
Если возникает спорный вопрос, может ли какая-либо категория А быть подкатегорией для категории Б, следует найти ответ на вопрос: существует ли (или может потенциально быть написана) статья, которая подходит для категории А, но не уместна в теме категории Б. Если такая статья есть, категорию А нежелательно делать подкатегорией для Б. Пример: Категорию Категория:Наркотики не следует включать в категорию Категория:Лекарственные средства, поскольку не все наркотики являются лекарственными средствами. Как же совместить такие категории? Если такое совмещение необходимо, можно создать категорию Категория:Наркотики, являющиеся лекарственными средствами.
«Красные» категории
Наличие «красных» (ещё не созданных) категорий в статье в общем случае не является причиной их удаления. Причинами удаления категорий (как уже существующих, так и «красных») из статьи могут являться:
- ошибки в названии категории или несоответствие принятым стандартам именования категорий в данном разделе — такие названия должны исправляться (не обязательно на уже существующие категории)
- несоответствие названия категории тематике статьи
- наличие более узкой категории в данной ветке, более точно соответствующей тематике статьи — в этом случае категория уточняется.
- наличие в статье одновременно более общей и более узкой категорий из одной и той же ветки — в этом случае более общая категория из статьи удаляется.
Во всех остальных случаях категория должна быть оставлена.
Для изображений
Изображения не стоит включать в общие категории, описывающие статьи, а категоризировать их нужно в рамках категории «Изображения по темам».
Название категории должно начинаться с префикса «Изображения:». Категоризировать изображения по источникам и по лицензиям нужно при помощи соответствующих шаблонов — см. RuData:Шаблоны/Лицензии изображений.
Сортировка в категориях
Как уже было сказано выше, статьи в категориях сортируются в алфавитном порядке автоматически.
Порядок сортировки
Порядок сортировки в категориях идёт в соответствии с ASCII:
./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_'abcdefghijklmnopqrstuvwxyz{|}~
Пробел находится в начале данной последовательности. Буквы кириллического алфавита располагаются после данной последовательности и сортируются в соответствии с юникод-кодами:
АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯабвгдежзийклмнопрстуфхцчшщьыъэюяЁё
Ключ сортировки
Для сортировки статей в категориях в РуДате используются ключи сортировки. Есть два способа сортировки при помощи ключей:
- Добавление {{СОРТИРОВКА|ключ сортировки}} устанавливает ключ сортировки по умолчанию для всех категорий, в которую входит статья;
- Добавление, [[Категория:Название категории|ключ сортировки]] в статье устанавливает сортировку для отдельно взятой категории.
Нет необходимости использовать ключ сортировки в тех случаях, когда название статьи состоит из одного слова, а также тогда, когда первое слово в заголовке и является ключевым, ведь система отсортирует их автоматически.
Иногда требуется вынести статью в самое начало категории (как например в случае с обзорной статьёй) — для этого используйте специальный ключ сортировки, например, знак пробела или «*»: «[[Категория:Имя категории| ]]» (ключ сортировки — то, что указано после вертикальной черты; в данном случае — пробел).
Конкретные особенности
Большинство статей не требуют использования ключа сортировки, к тем же, которые требуют, следует подходит с осторожностью. Прежде чем добавлять ключ сортировки, следует спросить себя, на какую букву средний человек обычно станет искать ту или иную статьи, и только выяснив этот вопрос, можно приступать к действиям.
Для персоналий обычно этим ключевым словом является фамилия, при этом не суть важно вымышленная она или нет. С очень высокой вероятностью писателя Марка Твена будут искать на букву Т, несмотря на то что Твен — не фамилия. Таким образом в этом случае следует использовать ключ сортировки {{СОРТИРОВКА|Твен, Марк}}. Многие люди не имеют фамилий, но тем не менее имеют в составе своего имени, элемент(это может быть прозвище, титул, отчество) который является ключевым при цитировании этой персоны — так, например, в имени Саддам Хусейн — Хусейн — не фамилия, а отчество, но тем не менее скорее всего наиболее оптимальным вариантом будет использование именно его в качестве ключа для сортировки {{СОРТИРОВКА|Хусейн, Саддам}}. Есть также некоторые количество случаев, когда человек больше известен по личному имени, и при этом имеет фамилию — в этом случае опять же следует исходить из того, на какую букву большинство пользователей РуДаты скорее всего будут искать того или иного человека.
Похожий подход используется и для других статей, так например — в РуДате может быть несколько статей посвященных разновидностям телевидения: Аналоговое телевидение, Цифровое телевидение. Достаточно логично и привычно для многих читателей, если все они будут стоять на букву «Т» вместе с основной статьёй, посвященной телевидению. В этом случае ключ сортировки будет представлять из себя нечто подобное: {{СОРТИРОВКА|Телевидение, аналоговое}}.
Ключи сортировки для изображений
Изображения сортируются в алфавитном порядке по их полному имени, включая префикс пространства имён изображений «Изображение:». Поэтому при использовании ключа сортировки для изображений также необходимо включать в него данный префикс, иначе эти изображения на странице категории будут расположены до «Изображение:A» или же после «Изображение:я». Есть и другая возможность — использовать ключи сортировки для всех изображений.
Таким образом, список изображений можно рассматривать как три последовательности: A-И, Изображение:(A-Я), И-Я. Можно исправить первую и третью последовательности, добавив необходимый префикс в их ключи сортировки, а можно — вторую, добавив всем изображениям ключи сортировки без префикса.
Тот же порядок действий применяется и в случае других пространств имён. Однако пространство имён категорий («Категория:») является исключением: по умолчанию сортировка не учитывает влияние префикса, чтобы избежать помещения всех подкатегорий в подгруппу буквы «К». Следовательно, при использовании ключей сортировки также не следует использовать префикс.
Организация категорий
Большие категории
Если категория большая, она делится на несколько страниц. Страница, озаглавленная, к примеру, «Персики—Померанцы», отображает все подкатегории, статьи и изображения с именами, расположенными по алфавиту между этими словами. Несколько путано выглядит то, что отображается только количество статей и подкатегорий, входящих в данный диапазон, а не общее их число в категории. Секция описания категории повторяется на всех страницах.
Чтобы вынести все подкатегории (до 200 максимум) на первую страницу, используйте специфичный ключ сортировки, например, знак пробела или «*»: «[[Категория:Имя категории| ]]» (ключ сортировки — то, что указано после вертикальной черты; в данном случае — пробел).
Примеры больших категорий:
- с большим количеством статей: Категория:Персоналии по годам рождения
- с большим количеством изображений: w:Category:Public domain images
Списочные категории
Списочные категории (Категория:Списки и её подкатегории) — служебный раздел иерархии категорий, в который должны включаться только списочные статьи (основное содержание которых составляет список ссылок на другие статьи), название которых обычно (но не всегда) начинается со слова «Список…». Эти категории всегда дополняют, а не заменяют категории «основных» тематических разделов.
Для удобства навигации, название таких категорий (так же, как и у входящих в них статей) обычно (но не всегда) начинается со слова «Списки…».
Все статьи, содержащие списки, в том числе списки, оформленные в виде таблиц, помимо основной (тематической) категории, следует вносить в категорию Категория:Списки, или какую-либо из её подкатегорий (например, Список рек Словакии — в категорию Категория:Списки:География).
Не следует включать в ветку «Списки» целиком категории, содержащие не только списочные статьи.
Словари (глоссарии) терминов
Статьи, содержащие словари (глоссарии) терминов должны включаться в категорию Категория:Словари в РуДате.
Ссылки на категории в тексте
Если вы хотите просто сослаться на категорию, не добавляя в неё текущую страницу, добавьте двоеточие (:) в начале ссылки: [[:Категория:Имя_категории]].
Существующие категории
Список всех категорий, присутствующих в русской части РуДате, вы можете увидеть здесь — Служебная:Categories. Тут отображены все категории, включая и те, которые содержат подкатегории или страницы, но не имеют текста описания (то есть их страница не была отредактирована, на неё просто создали ссылку). В этом случае ссылки на эти страницы будут выглядеть как ссылки на несуществующие страницы (обычно помечаются красным цветом) и вести прямо на страницу редактирования. Во избежание этих осложнений рекомендуется хотя бы заглянуть на страницу категории, в которую вы поместили свою статью, и добавить ссылку на категорию порядком выше.
Слежение за внесением страниц в категорию
Используя «Связанные правки», любой может найти страницы, недавно внесённые в категорию путём добавления в них соответствующего тэга или тэга шаблона, внесённого в категорию. Добавление страниц путём внесения тэга директории в используемый ими шаблон отслеживается непрямым образом: можно отследить изменения шаблона, а затем найти страницы, его использующие. При этом отображаются страницы, потенциально присутствующие в категории.
«Ссылки сюда»: сходства и различия
Категории напоминают страницу «Ссылки сюда», дополненную и расширенную.
Однако «Ссылки сюда» содержит ссылки, связь которых с основной страницей может быть весьма слаба, в то время как в одну категорию обычно помещают страницы сходной тематики.
Тестовые страницы, страницы пользователей и прочие обычно не вносятся в категории, дабы избежать их захламления, в то время как простые ссылки на страницы (которые можно отследить, используя «Ссылки сюда») достаточно безобидны.
Категории автоматически сортируются по алфавиту, в то время как «Ссылки сюда» сортируются периодически, во время пересборки таблицы ссылок в базе данных.
«Ссылки сюда» могут содержать не более 500 страниц. Категории могут быть гораздо больше.
Применение страниц «Ссылки сюда» и «Связанные правки» к категориям
В «Ссылках сюда» отображаются только ссылки на страницу категории, не на страницы, включённые в неё.
До версии MediaWiki 1.4 так же обрабатывались и «Связанные правки».
Однако, начиная с версии 1.4, «Связанные правки» отображают изменения на страницах, входящих в категории (согласно с текущей страницей категории, то есть исключая потенциально внесённые и включая потенциально удалённые страницы, связанные с изменением присутствующих в них шаблонов путём внесения/удаления в них тэга категории):
- для подкатегорий: только изменения в их секции описания;
- для изображений (страниц описания изображений): аналогично.
При этом не отображаются изменения в страницах, ссылки на которые внесены в описательную секцию категории. Пути обхода данной проблемы:
- Вынести секцию описания в отдельный шаблон. Тэги категорий (всё равно не оказывающие влияния на «Связанные правки») лучше не вносить в шаблоны, потому что на страницах их надкатегорий шаблон будет отображаться вместе с прочими внесёнными туда статьями. Имеются ли в шаблоне интервики-ссылки (любого типа) или нет — неважно, потому что данный шаблон не будет использоваться где-либо ещё.
- Использовать «Связанные правки» страницы, вызывающей категорию как шаблон: {{:Категория:Имя категории}}; в эту страницу будет включена только раздел описания. Для этой цели создаётся специальная страница, которая может обслуживать несколько категорий. Однако, данная страница будет отображаться на страницах «надкатегорий» каждой из использованных категорий.
Обычно (если не использовать «Наблюдение за страницей») изменения на страницах обсуждения не отображаются.
Заголовки в списке изображений
Как уже упоминалось, по умолчанию отображаются первые 20 символов имени изображения, дополненные троеточием, если произошло усечение. Это может быть весьма неудобно, например commons:Category:William-Adolphe Bouguereau содержит большое количество картин, озаглавленных в виде «William-Adolphe Bouguereau (1825—1905) — (название)», однако все они отображаются как «William-Adolphe Boug…» (см. последнюю секцию категории).
Полное имя изображения можно увидеть лишь во всплывающей подсказке и в строке состояния браузера, причём вместо некоторых символов будут отображаться их коды, например, «%28» вместо "(".
Таким образом, поиск нужной картины по её имени в данном списке весьма затруднён. Возможно, следует именовать изображения более простым образом: "Bouguereau, ", а затем название картины (до тех пор, пока в MediaWiki не появится средств, решающих эту проблему).
Дерево категорий
Существует тэг «categorytree», который позволяет на любой странице включить в текст динамически изменяющийся фрагмент дерева категорий.
Пример использования:
Текст |
<categorytree>Всё</categorytree> |
<categorytree style="float:right; clear:all; margin-left:1ex; border:1px solid gray; padding:0.7ex; background-color:white;">Всё</categorytree> |
---|---|---|
Результат |
[+] Информация
[+] Образование
|
[+] Информация
[+] Образование
|
Эта функциональность обеспечивается специальным расширением MediaWiki — CategoryTree.
Разворачивание категорий
На МетаВики проходит дискуссия по поводу возможности разворачиваемых страниц категорий. То есть на странице категории cмогли бы отображаться ссылки на статьи её подкатегорий, подподкатегорий и т. д. См. m:Category flatten и здесь.
Проблемы с категориями
Кэширование
Если шаблон включается в категорию, то в указанную категорию помещается не только шаблон, но и все страницы, включающие его, поэтому удобно использовать шаблоны для рубрикации статей.
Но может возникнуть проблема с кэшированием — если поменять категорию у шаблона, то категория у включающих этот шаблон страниц поменяется только после выполнения каких-либо правок этих страниц (не обязательно при этом что-либо менять, то есть операция правки может быть чисто формальной).
Более подробно этот вопрос рассмотрен в статье «механизм шаблонов».
Захламление категорий
Ссылки с тестовых пользовательских и тому подобных страниц захламляют категории. Поэтому рекомендованы следующие ограничения при копировании:
- всегда удаляйте тэг категории при копировании текста;
- при включении шаблона, присутствующего в категории, не пользуйтесь его возможностями, применяйте «subst:» или ручное копирование тела шаблона, затем удаляйте тэг категории.
Списки против категорий
Для сравнения см.:
- m:Category:Demo и m:Category talk:Demo (страница обсуждения);
- w:en:Wikipedia:Merge lists to categories
- w:en:Category:Lists that should be categories
Служебные страницы
- Дерево категорий
- Все категории
- Категории, на которые больше всего ссылок
- Неиспользуемые категории
- Некатегоризованные категории
- Страницы, включённые в большое количество категорий
- Требуемые категории