The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Создатели Wikipedia представили проект структурированной базы данных Wikidata

02.04.2012 20:40

Фонд Wikimedia анонсировал новый проект - Wikidata, в рамках которого планируется подготовить доступную для совместного наполнения структурированную базу данных, в которой будут собраны разнообразные сведения и знания. Это первый значительный проект Wikimedia за последние 7 лет. Wikidata станет центральным сервисом для доступа к структурированным данным из всех статей свободной энциклопедии, примерно как в настоящее время Wikimedia Commons выступает в роли хранилища мультимедиа файлов.

Например, в Wikidata может быть сохранена численность населения определённого города, к которой в дальнейшем можно обращаться из статей Wikipedia по ключу с названием города и атрибутом, ассоциированным с численностью населения. При необходимости изменения данных, достаточно будет поправить запись в БД, после чего во всех статьях энциклопедии, упоминающих численность населения города N, будут использоваться новые сведения, без необходимости ручного выявления и правки этих статей. Кроме численности населения, можно сопоставить с городом различные географические и политические сведения, такие как имя мэра города, телефонный код, города-спутники и т.п.

Данные будут доступны не только для ручного редактирования, но и для полностью автоматизированной машинной обработки. Таким образом, данные могут быть задействованы в разнообразных сторонних приложениях, таких как системы аннотирования научных статей. Система будет поддерживать гибкие средства локализации, позволяющие хранить единые представления фактов на всех языках, поддерживаемых в Wikipedia (даже если статья не переведена, для всех языков можно будет вывести типовые факты). Данные будут предоставляться на условиях лицензии Creative Commons.

На разработку начального прототипа проекта выделено 1.3 млн евро, половина из которых пожертвовано Институтом решения проблем искусственного интеллекта (AI²), созданного Полом Алленом. Остальную часть финансирования предоставила компания Google и фонд Gordon and Betty Moore Foundation. По мнению вице-президента института AI² проект Wikidata является следующим шагом эволюции Wikipedia, трансформируя способ размещения энциклопедических данных, делая их доступными более широкой аудитории. Проект Wikidata будет основан на семантических технологиях, которые позволят упростить выявление нужных сведений.

Разработка проекта разделена на три фазы. Первую фазу планируется завершить в августе нынешнего года. На данной стадии будет проведена работа по централизации ссылок между версиями Wikipedia на разных языках. На второй стадии, результаты которой планируется представить в декабре 2012 года, редакторы получат возможность добавления и использования данных в Wikidata. Финальная фаза ознаменует собой появление средств для автоматического создания списков и схем, основанных на данных в Wikidata.

  1. Главная ссылка к новости (http://blog.wikimedia.org/2012...)
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/33511-wikidata
Ключевые слова: wikidata, wikimedia
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (58) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Адольф (?), 21:45, 02/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +9 +/
    Wikipedia отличный пример того, какие замечательные вещи может создавать некоммерческое общество
     
     
  • 2.20, Самый цимес (?), 10:22, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Надо добавлять фразу "на пожертвования". Полностью какие замечательные вещи может делать некоммерческое сообщество на пожертвования. И вся радость куда-то пропадает.
     
     
  • 3.24, FractalizeR (ok), 11:10, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Куда она пропадает? На одном энтузиазме их инфраструктуру не удержать. Что плохого в том, что проект существует на пожертвования?
     
     
  • 4.26, Аноним (-), 11:17, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • –11 +/
    Правда, сюрприз, аноны? - коммунизма нет. Все в этом мире стоит деньги. И лишь время анонов совершенно бесплатно. Прошу заметить - безвозвратно уходящее время.
     
     
  • 5.29, robux (ok), 13:24, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Сюрприз для тебя, сорос-недоучка: есть люди их желания и дела. А про деньги иди гусям расскажи.
     

  • 1.4, Аноним (-), 21:49, 02/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • –2 +/
    А если ее(викидату) обрушат - обрушатся все ссылающиеся проекты?
     
     
  • 2.6, Аноним (-), 21:53, 02/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Капитан, не скромничайте.
     
  • 2.21, тоже Аноним (ok), 10:40, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    База данных - потенциально куда более надежное хранилище, чем файлопомойка.
    Ее можно динамично реплицировать, дублировать, кэшировать... при этом вы будете работать со структурированной информацией, а не с аморфной кучей.
     
  • 2.60, XoRe (ok), 00:53, 04/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > А если ее(викидату) обрушат - обрушатся все ссылающиеся проекты?

    Берите больше - представьте, что будет, если порушить гугль со всеми его сервисами!
    Дело за малым - обрушить)

     

  • 1.5, Аноним (-), 21:51, 02/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Это будет в RDF?
     
     
  • 2.7, Аноним (-), 21:54, 02/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    plain text
     
     
  • 3.8, Аноним (-), 21:55, 02/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    >The data will be exported in different formats, especially RDF

    Таки RDF, а это вин! веб 3.0 подкрался незаметно...

     
     
  • 4.9, Все тот же аноним (?), 22:56, 02/04/2012 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Таки RDF, а это вин!

    Большую чушь сложно придумать. Вы вообще представляете, что есть RDF?

    По тексту новости: судя по анонсу, есть сомнения в том, что разработчики понимают, каким образом должны быть структурированы данные. На самом деле задача гораздо шире анонсируемой и при текущей политике организаторов решения не имеет. Абсолютно необходимые шаги - контекст и семантические отношения, реализовать которые в данном случае будет сложно.

     
     
  • 5.12, Avator (ok), 23:46, 02/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Зачем вы так категорично?
    Почитайте книгу Тима Бернерса Ли "Weaving Semantic web".
    Это как раз Web 3.0 и есть по сути =) Точнее первые  шаги в эту сторону.
     
     
  • 6.18, Все тот же аноним (?), 07:49, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    По сути это кривая поделка. Волшебных слов RDF для взлета недостаточно. До Web 3.0 - как до Луны пешком.

    Куча способов рефакторинга с учетом, кстати, методов, позволяющих рубить бабло.

     
     
  • 7.63, Avator (ok), 03:50, 04/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > По сути это кривая поделка. Волшебных слов RDF для взлета недостаточно. До
    > Web 3.0 - как до Луны пешком.
    > Куча способов рефакторинга с учетом, кстати, методов, позволяющих рубить бабло.

    Извините, я как-то Тиму Бернерсу Ли немного больше верю =)

     

  • 1.10, Аноним (-), 22:59, 02/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Так вот ты какой, 1984…
     
     
  • 2.16, 123 (??), 00:38, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    да, что б много газет не перепечатывать!
     

  • 1.14, Marbleless (?), 00:15, 03/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • –3 +/
    Я джва года ждал...
     
  • 1.15, Аноним (-), 00:26, 03/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +10 +/
    Это проект немецкой Wikimedia Deutschland. Все хорошие нововведения в Википедии последнее время идут от немцев (например, интеграция с OpenStreetMap, поддержка TIFF, создание toolserver - хостинга для скриптов, нужных для различных околовикипедийных работ и т.д.). Американский же фонд, хотя и получает львиную долю пожертвований, полностью импотентен и управляется достаточно малоадекватными товарищами. Поэтому неприятно видеть, что это достижение в новости приписано именно американцам.
     
     
  • 2.23, минонА (?), 10:57, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Зато у американских товарищей большие слёзные глаза и и стоять с протянутой рукой получается лучше. А для попрошаек это важнее идейности и креативности.
     
  • 2.37, abc (??), 14:23, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    У всех четко разделенные обязанности: американцы деньги добавыют, немцы нововведения делают :)
     

  • 1.22, Аноним (-), 10:41, 03/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Я правильно понимаю, что они хотят вики загнать в семантическую сеть? То есть, по сути, вместо базы данных построить базу знаний, а отношения описывать (в том числе) на JSON?
     
     
  • 2.25, Ваня (??), 11:13, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Да. Только вот задача нерешаема на нашем уровне знаний.

    Простой пример: опишите ВСЕ отношения которые связывают "дом" и "собаку". Включая то что они оба являются материальными (физика материальных тел), существуют только на планете Земля (ссылка на Землю, отсюда хвостик на Солнечную систему и нашу Галактику), и т.д.

     
     
  • 3.27, тоже Аноним (ok), 13:02, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    "Мы сами знаем, что она не имеет решения, – сказал Хунта, немедленно ощетиниваясь. – Мы хотим знать, как ее решать" (АБС)
    "Замахивайся на великое, чтобы сделать хотя бы малое" (тоже кто-то из классиков)
    Проще говоря, не можешь решить большую проблему - решай попутные.
     
  • 3.30, Crazy Alex (ok), 13:38, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    А если не выпендриваться - получаем просто удобное хранилище для фактажа, который в википедии уже есть. Вроде того же населения городов. По факту это означает основательное упрощение жизни для различных языковых версий как минимум.
     
     
  • 4.32, Ваня (??), 14:04, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Почитай историю языка UNL (Universal Network Language), разрабатываемого в 80-90-е годы. А уже потом, владея знаниями и не "выпендриваясь" сделай выводы.
     
  • 4.34, Аноним (-), 14:08, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Мне кажется что вы тут не правы. Между БД и БЗ разница существенная: БД - хранит данные, БЗ - описывает предметную область. У БД я могу запросить данные, а с помощью БЗ я могу разрешить в истину или ложь свое утверждение.

    Согласитесь, что есть разница между запросом "какая численность Москвы" и запросом "Москва большой город?" А ведь стоит только добавить правила преобразований (критерии), и вуале! - экспертная система готова.

    Да, инструментальные средства нужны иные. Но кое-что уже есть. К примеру ЯП Пролог.

    Короч, первый шаг к Скайнет сделан, имхо.

     
     
  • 5.35, Ваня (??), 14:11, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    И вы тоже почитайте про UNL.
     
     
  • 6.36, Аноним (-), 14:21, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Речь идет, как мне кажется, не об UNL 80-х,  а уж скорее о трудах академика Поспелова (http://www.ccas.ru/personal/g_pospel/g_pospel.htm) в области семантических сетей в 60-х.
     
     
  • 7.38, Ваня (??), 14:33, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    И их тоже. А вдовесок что GREEN и ЗЕЛЁНЫЙ это не одно и то же. Когда анонимам станет понятно почему так, тогда и часть проблемы для них прояснится.
     
     
  • 8.39, Crazy Alex (ok), 15:31, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Да нет с этим всем никаких проблем если не пытаться клепать универсальное решени... текст свёрнут, показать
     
     
  • 9.42, Ваня (??), 16:18, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    В русской вики есть раздел Синтоистские святилища В русской их 25, английской... текст свёрнут, показать
     
     
  • 10.43, Crazy Alex (ok), 16:51, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Лечитесь от перфекционизма Где получится - будут использовать И, понятное дело... текст свёрнут, показать
     
     
  • 11.45, Все тот же аноним (?), 16:54, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Фатальное заблуждение ... текст свёрнут, показать
     
     
  • 12.47, Crazy Alex (ok), 16:58, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    А детальнее ... текст свёрнут, показать
     
     
  • 13.49, Все тот же аноним (?), 17:19, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Много лучше - обманчивое впечатление Много быстрее и много больше - да ... текст свёрнут, показать
     
     
  • 14.50, Crazy Alex (ok), 17:24, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Ну так в случае википедии которая нужна для быстро и примерно посмотреть это... текст свёрнут, показать
     
  • 11.62, XoRe (ok), 01:26, 04/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    А вы в курсе, что современные БД работают по принципам этих глинаных табличек Н... текст свёрнут, показать
     
  • 10.44, Все тот же аноним (?), 16:51, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Это первая проблема из тех, что на поверхности синхронные языковые эквиваленты ... текст свёрнут, показать
     
     
  • 11.46, Crazy Alex (ok), 16:58, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    В пень перфекционизм Вам же не AI на этом и только на этом обучать С эквивал... текст свёрнут, показать
     
     
  • 12.48, Все тот же аноним (?), 17:16, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Да Два варианта криво и очень криво Разумеется, есть И не только национальны... текст свёрнут, показать
     
     
  • 13.51, Crazy Alex (ok), 17:34, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    У локализаций, в общем-то, ровно две проблемы разная структура предложений и ом... текст свёрнут, показать
     
     
  • 14.52, Ваня (??), 18:01, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    А вот здесь мы приходим к GREEN и ЗЕЛЁНЫЙ Это не одно и то же Опросив носителе... большой текст свёрнут, показать
     
     
  • 15.54, Crazy Alex (ok), 19:55, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Так в том и дело, что как раз я на идеальный мир не претендую Создатели википед... текст свёрнут, показать
     
     
  • 16.56, Ваня (??), 20:49, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Мне кажется или вы стали говорить за всю википедию, а возможно что и за весь мир... текст свёрнут, показать
     
     
  • 17.59, тоже Аноним (ok), 23:30, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Могу вам сказать за весь мир ни периодическая система элементов, ни формулы нью... текст свёрнут, показать
     
  • 16.58, Все тот же аноним (?), 22:13, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Или сделал это за бабло Или с какой-то конкретной целью Знаете, я даже примеро... текст свёрнут, показать
     
  • 15.61, XoRe (ok), 01:19, 04/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Это фигня Вот есть хороший пример ваших аргументов http ru wikipedia org wik... текст свёрнут, показать
     
     
  • 16.64, тоже Аноним (ok), 08:58, 04/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Зачем слать уведомления об изменениях Вики сама это прекрасно делает Я подписа... текст свёрнут, показать
     
  • 14.53, Все тот же аноним (?), 18:46, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Сильно больше Ниже уже написано, не буду повторяться И получите ту же гору мус... текст свёрнут, показать
     
     
  • 15.55, Crazy Alex (ok), 20:06, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Не видел ни одного примера Если речь о зеленом - то к википедии это отношения... текст свёрнут, показать
     
     
  • 16.57, Все тот же аноним (?), 22:06, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Это не мелкие недоработки Это незнание основ проектирования Разумеется Но п... текст свёрнут, показать
     
  • 2.41, Crazy Alex (ok), 15:37, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Нет, неправильно. Они хотят уложить в базу то, что туда укладывается. Особенно легко это для различных числовых данных и классификаций вроде "Бостон - это город".
     

  • 1.31, robux (ok), 13:51, 03/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Wikidata - это конечно шажок вперед.
    Но реальным шагом, имхо, будет создание свободной распределенной базы.

    Т.е. чтобы база городов (например) хранилась не на пендосских или путинских серверах, а на тысячах-миллионах компьютерах пользователей/организаций по всему миру. Вот это будет реальный прорыв!

    А так, мы получаем подколпаковую базу: Большой Брат захотел сманипулировать - поправил цифру в WikiData, и пипл массово схвавал.

     
     
  • 2.33, Ваня (??), 14:06, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Скорее не "большой брат", а один попрошайка, грозившийся закрыть ресурс если ему не отстегнут N лямов зелени. И его аппетиты с каждым годом растут.
     
  • 2.40, Crazy Alex (ok), 15:32, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > Wikidata - это конечно шажок вперед.
    > Но реальным шагом, имхо, будет создание свободной распределенной базы.
    > Т.е. чтобы база городов (например) хранилась не на пендосских или путинских серверах,
    > а на тысячах-миллионах компьютерах пользователей/организаций по всему миру. Вот это будет
    > реальный прорыв!
    > А так, мы получаем подколпаковую базу: Большой Брат захотел сманипулировать - поправил
    > цифру в WikiData, и пипл массово схвавал.

    У них всю жизнь все базы были открытыми, навреняка и дальше там будет. Есть желание - версионируйте, отслеживайте изменения. Объём там по сравнению с википедией будет смехотворный, объём правок - тем более.

     

  • 1.66, Аноним (-), 22:02, 09/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Качество в Wikipedia не хватает... качества. А на не коммерческом проекте его не будет. Одной духовной пищей сыт не будешь.
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру