The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Введён в строй сервис для анализа версий пакетов в репозиториях, opennews (?), 17-Ноя-16, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


17. "Введён в строй сервис для анализа версий пакетов в репозитор..."  +3 +/
Сообщение от AMDmi3 (??), 17-Ноя-16, 09:37 
>>мощная система правил преобразования названий к "общему знаменателю"
> Или, по-простому, костыли

Естественно. А по-другому никак, потому что один и тот же пакет и даже одну и ту же версию могут называть кучей разных способов. Я надеюсь проект поможет это исправить, для себя я даже знаю какие порты можно переименовать во FreeBSD, но и с простынёй правил можно неплохо жить.


Ответить | Правка | Наверх | Cообщить модератору

42. "Введён в строй сервис для анализа версий пакетов в репозитор..."  +/
Сообщение от Аноним (-), 17-Ноя-16, 14:41 
>Естественно. А по-другому никак, потому что один и тот же пакет и даже одну и ту же версию могут называть кучей разных способов.

По-другому еще как. Развертываете на своих серверах в Яндексе 100500 всех возможных дистрибутивов и версий, а далее на основе их систем, их внутренних репозиториях выделяете пакеты и привязываете по основным урлам к собственно архивам программ, кои обычно лежат либо на авторских серверах, либо в конкретных репах, по конкретным адресам, с конкретными... Вобщем, все можно сопоставить и с точностью до миллиметра.
Просто вам столько не платят =)

Ответить | Правка | Наверх | Cообщить модератору

45. "Введён в строй сервис для анализа версий пакетов в репозитор..."  +/
Сообщение от AMDmi3 (??), 17-Ноя-16, 14:56 
Развёртывать дистрибутивы для этого совершенно не нужно, но идея сравнивать по upstream url отличная, добавил себе issue. 100% результатов это, правда, всё равно не даст, к тому же не везде url просто выпарсить.
Ответить | Правка | Наверх | Cообщить модератору

50. "Введён в строй сервис для анализа версий пакетов в репозитор..."  +/
Сообщение от Аноним (-), 17-Ноя-16, 16:14 
Для 100% сопоставления нужен только адрес архива, который используется в сборке. Тогда будет 100%. Как парсить или не парсить эти адреса это дело десятое, ясно, что выполнить задачу возможно. Успехов.
Ответить | Правка | Наверх | Cообщить модератору

55. "Введён в строй сервис для анализа версий пакетов в репозитор..."  +/
Сообщение от AMDmi3 (??), 17-Ноя-16, 16:24 
> Для 100% сопоставления нужен только адрес архива, который используется в сборке

В сборках и сводных данных репозитория его нет почти никогда, потому что после сборки он уже никому не нужен. А полноценно парсить исходники (ebuild, pkgbuild, slackbuild, .spec, порты) - нетривиальная задача.

> Тогда будет 100%

Не будет, будет только возможность сказать что некоторые пакеты имеют одну версию, даже при том что она записана по-разному. В некоторых случаях это улучшит сравнение, в других не даст ничего.

Ответить | Правка | Наверх | Cообщить модератору

69. "Введён в строй сервис для анализа версий пакетов в репозитор..."  –1 +/
Сообщение от Аноним (-), 17-Ноя-16, 17:31 
Жалко мне не платят за идеи =) Чтобы я сделал на мощностях Яндекса?
1. Парсим ebuild, pkgbuild, slackbuild, .spec, порты
2. Извлекаем имя проекта/пакета
3. Извлекаем адреса файлов с архивом
4. Выкачиваем архив к себе + запоминаем откуда выкачали его
5. Для сопоставления пакета в одном дистрибутиве с другим пакетом с тем же именем, для выяснения (уместней сказать уточнения) версии в случае спорной ситуации, когда используется зеркало (другой URL) выкачиваем второй архив и далее по чексам выясняем % схождения.
6. Если имя, версия одинаковы, но есть расхождение в архивах, то тут нужна доп. логика, которую придется додумывать вам. Таких ситуаций, именно расхождения сумм должно быть менее 5%, если не около 1-2%.
7. Данные по расхождениям могут использоваться для аналитики, с последующими публикациями по найденным "артефактам". Вполне можно найти что-то стоящее.

Все это нереально выводит проект на след. уровень, где методология с архивами лишь дополняет вашу логику на приличный процент "попаданий", а при соответсвующих доработках может довести и до 100%. Вопрос в том, что для вас является 100% попаданием. Пока что я слышу речь о названиях и версиях. Я же предлагаю большее... и сложнее в реализации. С соответсвующим выхлопом на выходе =)

Смотрите сами надо вам это или не надо.

Ответить | Правка | Наверх | Cообщить модератору

71. "Введён в строй сервис для анализа версий пакетов в репозитор..."  +1 +/
Сообщение от AMDmi3 (??), 17-Ноя-16, 17:53 
> Жалко мне не платят за идеи =) Чтобы я сделал на мощностях Яндекса?

Мощности Яндекса тут никому не нужны, всё можно сделать на VPS 10G/1G/1core.

По остальному мне нечего добавить к написанному выше - парсить адреса файлов нетривиально, да, это поможет в некоторых случаях, но никакого "следующего уровня" не будет. Зачем вы что-то собрались качать я вообще не понял.

Ответить | Правка | Наверх | Cообщить модератору

52. "Введён в строй сервис для анализа версий пакетов в репозитор..."  +/
Сообщение от Crazy Alex (ok), 17-Ноя-16, 16:18 
А, так ты из тех персонажей, кто занимается это сомнительной идеей? Хм, ну тогда хотя бы понятно, чего ты её защищаешь.
Ответить | Правка | К родителю #45 | Наверх | Cообщить модератору

62. "Введён в строй сервис для анализа версий пакетов в репозитор..."  +/
Сообщение от Michael Shigorinemail (ok), 17-Ноя-16, 16:44 
> Развёртывать дистрибутивы для этого совершенно не нужно, но идея сравнивать по upstream
> url отличная, добавил себе issue. 100% результатов это, правда, всё равно
> не даст, к тому же не везде url просто выпарсить.

Можно пытаться делать нечёткое сравнение по спискам файлов, но это если забирать те исходники, а не только метаданные... ну и тоже случаев fp не оберёшься.

Ответить | Правка | К родителю #45 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру