spc
toodoo Поиск по блогу: Найти
spc
Блог toodoo / Умный каталог
Факт от toodoo: Самые популярные сайты вне зоны .ru? Это http://internetno.net , http://maxsite.org/ и http://roboxchange.com

Написал Главный по разговорам 12:14, 4.04.2007

Итак, встречаем… нет, не конкурента, “соседа” toodoo по лестничной площадке. На нашем подъезде вывеска “интернет-каталоги”. Живем дружно, следим друг за другом, на старших и младших не делимся. Irdir.info – один из проектов нового времени. С новыми идеями вокруг старых тем.

О том, как делать интеллектуальные каталоги сайтов в гостиной “toodoo + internet.ru” рассказывает автор проекта irdir.info – Ярослав Витязев.

- Расскажите немного о себе.

- Занимаюсь созданием и поддержкой собственных проектов в сети Интернет. В основном, это каталоги ресурсов Интернета. Более подробно при желании можно прочитать в моем интерактивном резюме.

- Почему вдруг именно каталог, а не какой-то другой проект вы решили делать?

- Знаете, мне всегда была интересна эта тема. Началось это сравнительно давно: я создал примитивный каталог ссылок для одного из своих некоммерческих проектов — сайта про озеро Байкал. И тут же столкнулся с проблемой — каталог заспамили. Я решил переработать его программную часть полностью, так появился каталог dir.org.ru.

Этот каталог содержал “ручную” систему пост-модерации. После трех недель работы модератором мне это изрядно надоело. Я заметил, что сам процесс модерации можно свести к более-менее формальному набору правил, следуя которому, компьютер мог бы заменить (или частично заменить) человека. Эта идея дала свет еще одному проекту —каталогу dir.ikernel.org.

Реализация dir.ikernel.org мне, откровенно говоря, никогда не нравилась: проект был сделан в спешке, без должного внимания к некоторым концептуальным проблемам, и я решил более основательно подойти к этой проблеме — проблеме создания каталога ресурсов интернет. Так появился проект интеллектуального каталога.

- Не слишком ли тотальное увлечение тегами сейчас – их много кто считает мусорным облаком на сайте, не больше.

- Теги являются чрезвычайно удобным инструментом для категоризации контента, причем какого угодно; именно за счет этого они получили столь широкое распространение. Также, теги накладывают минимум ограничений на пользователя и дают ему максимум свободы. Я считаю, что такая тенденция является вполне нормальной: как только появляется какой-то новый, удобный подход, он практически сразу получает повсеместное распространение, особенно, если речь идет о такой среде как интернет.

- Почему популярные в Рунете каталоги не используют теги?

- Для категоризации интернет-ресурсов существует несколько подходов, наиболее распространенным является таксономический — то есть категоризация при помощи заранее заданных администрацией каталога разделов. Такой подход является наиболее простым в плане реализации и поддержки. Также, некоторые каталоги используют фасетную классификацию — здесь есть тоже масса проблем, связанных  с поддержкой такой структуры, а именно — затраты на указание таких признаков для каждого регистрируемого ресурса.

В случае использования тегов (при фолксономическом подходе) существует некоторый риск: например, пользователи могут указать нерелевантные теги. Не совсем ясно как с этим бороться, формальных методов пока не существует. Вводить строгую модерацию для тегов, по моему мнению, весьма глупая затея — тем самым можно лишить пользователя той свободы, которую он получает при использовании такого подхода — т.е. лишить пользователя основного преимущества тегов.

Популярные каталоги весьма консервативны. Их руководству сначала нужно осмотреться, провести какие-либо пробные исследования, оценить эффективность, а затем уже думать о целесообразности внедрения такого подхода. Кроме того, у таких каталогов уже есть огромная база интернет-ресурсов — не совсем ясно каким образом указывать теги для уже существующих ресурсов: просить ли владельцев сайтов указать их, указать ли их самим (что совершенно некорректно). Я думаю, что если копать глубже, найдется еще с десяток проблем, которые необходимо решить.

- У вас в заголовке есть эпитет “интеллектуальный” – в чем этот “разум” проявляется?

- В задачи подсистемы искусственного интеллекта каталога входит:

- регистрация интернет-ресурсов и проверка возможности публикации контента;
- расчет рейтингов и ранжирование интернет-ресурсов (для расчета рейтингов используется ряд эвристических алгоритмов, а также некоторые адаптивные методы прогнозирования);
- фильтрация недоброкачественного содержания при помощи базы знаний.

Сам “интеллект” каталога спрятан внутри, увидеть его рядовому пользователю просто невозможно. Модель подсистемы искусственного интеллекта будет расширена: добавится возможность учета обратной связи с пользователями для борьбы с недоброкачественным содержанием в каталоге. Эта функциональность уже работает на сервере каталога для альфа-тестирования.

- Как сайты попадают в каталог?

- Путем регистрации информации о них пользователями. Любой пользователь может зарегистрировать сайт и впоследствии изменять или указывать дополнительную информацию о нем.

Пока реализован только один интерфейс регистрации интернет-ресурсов, причем сравнительно сложный — уже поступило около десятка жалоб и предложений на этот счет.

Планируется в ближайшее время внедрить дополнительный интерфейс, при помощи которого данные для регистрации сайтов собирались бы в интеллектуальном или частично автоматизированном режиме: пользователь вводит URL сайта, а интеллектуальный интерфейс пытается добыть информацию об интернет-ресурсе и предложить ее к использованию — при этом будет использовано Дублинское ядро и ряд эвристических методов.

- Расскажите, что такое “взвешенный рейтинг”, как он высчитывается?

- В каталоге используется уникальный подход для ранжирования интернет-ресурсов. Если говорить коротко: используется рейтинг-агрегат, содержащий в себе несколько компонент, рассчитываемых для каждого интернет-ресурса. Таким образом, на позицию интернет-ресурса в выдаче влияют несколько различных факторов, причем их число постоянно пополняется.

- Очень интересно узнать про все составляющие – Содержательный, Соответствия, Расходуемый, Статический и Штрафной рейтинги?

- Как было отмечено выше, взвешенный рейтинг содержит несколько компонент:

- содержательный рейтинг — рейтинг, отображающий уровень заполненности информации о ресурсе (чем больше информации об интернет-ресурсе сообщил его автор, тем выше содержательный рейтинг для этого ресурса);
- рейтинг соответствия — этот рейтинг показывает насколько описание интернет-ресурса в каталоге соответствует тому, что действительно содержится на сайте (если в описании сайта будет написано “Продаем молоко. Дешево.”, а сам сайт посвящен информационным технологиям, его рейтинг соответствия будет близким к нулю);
- расходуемый рейтинг используется как компонент, отражающий степень актуальности информации, он повышается при дополнении информации об интернет-ресурсе, при ее актуализации; и постепенно уменьшается в том случае, если автор сайта давно не актуализировал информацию о своем сайте;
- статический рейтинг — это бонус за определенные “заслуги”; в данный момент он повышается при установке обратной ссылки на каталог, но, в скором времени, будет разработана более интересная система бонусов для владельцев сайтов;
- штрафной рейтинг используется подсистемой искусственного интеллекта и нужен в тех случаях, когда необходимо наложить штрафные санкции на сайт, а блокировать интернет-ресурс нецелесообразно.

Алгоритмы расчета всех этих рейтингов постоянно модернизируются. В данный момент ведутся работы по усовершенствованию алгоритма расчета штрафного рейтинга.

- Планируется ли интеграция с каким-то сервисом закладок?

- Да, обязательно. Интеграция — это один из основных принципов современного интернета. Однако для этого нужно, чтобы каталог был достаточно протестирован, и все его функции работали стабильно, т.е. речь об интеграции с другими сервисами может идти только после того как пройдет этап бета-тестирования, который начался совсем недавно.

- Будут ли кнопки с данными ваших рейтингов для установки на сайт?

- Честно говоря, я не задумывался над этим. Однако этот вопрос поставлен в правильном направлении: помимо кнопок было бы весьма целесообразно предоставлять информацию о рейтингах в удобном для синдикации виде (например, в XML) — таким образом, любые другие приложения могли бы использовать эту информацию в собственных целях. Эта идея мне очень нравится, я обязательно над ней подумаю.

- Планируются ли коммерческие услуги?

- В данный момент нет. Я буду думать над этим вопросом после того, как ежесуточная посещаемость каталога превысит 3—4 тысячи уникальных посетителей. А пока это нецелесообразно.

- Какое участие в работе проекта принимают посетители, что создается самой системой?

- Посетители создают основной контент: предоставляют информацию об интернет-ресурсах, комментарии. Сам каталог предоставляет средства для обработки, хранения и представления этого контента. Система позволяет отслеживать недоброкачественное содержание и блокировать его различными способами. Также система предоставляет информацию об интернет-ресурсах в понятном для компьютеров виде — используются технологии Dublin Core, OpenSearch.

- У вас очень много технических деталей (про метаданные, например), но создается впечатление про какой-то шаблонный дизайн – эта проблема будет решаться? С логотипом тоже не все понятно.

- Да, разумеется. Данная проблема является наиболее актуальной. Довольно-таки сложно обернуть большой объем информации и функциональности в изящный и понятный конечному пользователю интерфейс. Как только все текущие технические доработки будут окончены, первым делом произойдет переработка дизайна.

То же самое касается логотипа каталога. Текущий логотип практически нигде не встречается на страницах самого каталога, несмотря на то, что он есть.

- Напоследок: откуда узнали про toodoo и как впечатления от сервиса?

Я увидел ссылку на toodoo в профиле какого-то участника на Хабре. При помощи toodoo я нашел несколько интересных сервисов и блогов, о которых раньше не слышал, затем решил зарегистрироваться.

У меня есть небольшое пожелание: хотелось бы помимо возможности перехода на страничку интернет-ресурса в toodoo иметь возможность сразу переходить на сайт, без промежуточной страницы (например, при помощи какой-нибудь иконки, расположенной сбоку от URL). И еще один момент: слэши справа от URL встречаются по всему сервису и мешают восприятию: думаю можно их убрать в тех случаях, когда они не нужны.

А, в общем, сервис отличный. Буду вашим постоянным пользователем.

Понравился текст? Подпишитесь на обновления сайта по RSS, читайте нас в Яндекс.Ленте или через аккаунт в LiveJournal

Читайте другие материалы нашего блога:



Комментарии

  1. Ro 21:14, 04.04.2007

    Все-таки я был первый: www.kotolog.ru

    [ответить]



  2. Amigo 22:21, 04.04.2007

    “искусственный интеллект”… ну-ну =)

    [ответить]



  3. Ярослав Витязев 05:59, 05.04.2007

    2Amigo:
    Попроще: элементы “искусственного интеллекта”… текущая реализация пока не претендует на звание ИИС.

    [ответить]



  4. punk 10:31, 05.04.2007

    Каталог понравился, продуманный, но пока сыроват. Если бы не интерью многое было бы непонятно:)

    >>У меня есть небольшое пожелание: хотелось бы помимо возможности перехода на страничку интернет-ресурса в toodoo иметь возможность сразу переходить на сайт, без промежуточной страницы (например, при помощи какой-нибудь иконки, расположенной сбоку от URL).

    +1

    [ответить]



  5. Яков Семенович 11:15, 24.04.2007

    Русский язык и литература, репетитор - Репетитор, русский язык и литература - Репетитор, русский язык, литература, врожденная грамотность, изящная словесность, Родная речь, Обучение школьников и абитуриентов русскому языку. Быстрое повышение успеваемости в школе. Подготовка к единому государственному экзамену, ЕГЭ, подготовка в ВУЗ

    [ответить]



  6. Яков Семенович 14:11, 18.06.2008

    Лучшие методики отмечают, что задачи преподавания русского языка в школе заключаются в том, чтобы:
    * научить учащихся содержательно, последовательно, грамотно выражать мысли в устной и письменной форме, для чего нужно вооружить их знаниями из области грамматики, словообразования, фонетики, лексики, фразеологии и стилистики, а также выработать умение пользоваться этими знаниями в речевой практике;
    * дать учащимся прочные орфографические и пунктуационные навыки;
    * обеспечить развитие мышления учащихся;
    * привить учащимся любовь к родному языку и желание применить полученные знания и умения в трудовой и общественной деятельности.
    Как известно, во многих школах не всегда следуют этим верным указаниям. Грамотность подрастающего поколения с каждым годом, увы, падает. Однако с обучением русскому языку и в прошлом дело обстояло далеко не прекрасно. Главным образом потому, что самая образцовая школа с самой образцовой методикой не способна учитывать индивидуальные особенности учащихся. Школьная методика может только указать правильные принципы изучения языка. Потому-то, например, даже при хорошем знании правил грамматики заметная часть учащихся пишет малограмотно.
    Существуют и превосходные методики по изучению художественной литературы в школе. Однако они пользуются еще меньшей популярностью, чем аналогичные методики по русскому языку.
    Выдающийся педагог Л. И. Тимофеев считал, что для понимания художественного произведения ученик должен получить как «минимум знание о языке, исторической обстановке, идеологии различных периодов русской жизни, наконец, о своеобразии характерных для них форм, стилей, жанров, течений». В какой нынешней школе преподаватель дает этот «минимум»?
    Еще печальнее обстоит дело с чувством прекрасного. На уроках литературы из художественного образа извлекают, как правило, отвлеченную идею, оставляя в стороне эстетическую сущность произведения. Нередко чувство прекрасного преподаватель гробит варварским методом, предлагая, например, «пересказать содержание» лирического стихотворения.
    Без эстетики анализ художественного произведения невозможен. Это очевидность. Нельзя упускать из виду, что художественная литература является искусством. А с другой стороны – желательно четко видеть конкретные ее связи с другими формами искусства: музыкой, живописью, архитектурой… Речь идет не об умозрительной общности стиля какой-нибудь эпохи, хотя и на это следует обращать пристальное внимание. Более важным и любопытным оказывается индивидуальное творческое влияние друг на друга представителей разных искусств, скажем, Брюллова на Гоголя. Или Лермонтова на Левитана: ко всему творчеству «поэта русского пейзажа» можно поставить эпиграф из стихотворения «Родина» – «огни печальных деревень». Прекрасному нравится соседствовать с прекрасным.
    Цель моего курса – обучение школьников и абитуриентов изящной

    [ответить]



Комментарий:

spc

Люди говорят о blog.toodoo.ru

Влад Миронов:
« заходите в моё сообщество audiobok.ucoz.ru »

Читать другие отзывы
Оставить свой отзыв
 
spc   spc
Copyright © 2006-2007 toodoo

ООО "Туду" ИНН 772862724