|
2.3, аноннн (?), 00:25, 02/07/2019 [^] [^^] [^^^] [ответить]
| +9 +/– |
ну ка, хотел бы посмотреть на парсер robots в 10 или хотябы в 100 строк кода
обрадуете нас своим изобретением?
| |
|
3.6, Аноним (6), 08:10, 02/07/2019 [^] [^^] [^^^] [ответить]
| –1 +/– |
Что делается в 10 строк != парсер robots.txt
Он мог и про отдельные функции говорить и вообще с другим языком сравнивать
| |
|
|
1.5, Аноним (5), 07:58, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
> Библиотека ... учитывает различные нюансы оформления,
Костыли чтоль? )))
| |
|
|
|
4.12, Аноним84701 (ok), 11:38, 02/07/2019 [^] [^^] [^^^] [ответить]
| +5 +/– |
>> Опечатки, например, diasllow
> эксперты опеннета, как всегда. Нет, думать за вас и исправлять ваши опечатки
> этот парсер не обучен.
Эк вы … самокритичны (впрочем, как обычно):
https://github.com/google/robotstxt/blob/master/robots.cc#L696
bool ParsedRobotsKey::KeyIsDisallow(absl::string_view key) {
return (
absl::StartsWithIgnoreCase(key, "disallow") ||
(kAllowFrequentTypos && ((absl::StartsWithIgnoreCase(key, "dissallow")) ||
(absl::StartsWithIgnoreCase(key, "dissalow")) ||
(absl::StartsWithIgnoreCase(key, "disalow")) ||
(absl::StartsWithIgnoreCase(key, "diasllow")) ||
(absl::StartsWithIgnoreCase(key, "disallaw")))));
| |
|
5.14, пох. (?), 13:25, 02/07/2019 [^] [^^] [^^^] [ответить]
| –1 +/– |
о, хренассе, это вот прямо в основном коде.
впрочем, пользы от поделки все равно никакой - https://www.opennet.ru/openforum/vsluhforumID3/117784.html#11
(ведь сиплюсплюсики такой низкоуровневый язычок, что для банальной задачи обработки текстового файла из десятка предопределенных строк надо притащить за собой мильен каких-то мусорных гуглоисходников и собирать это все нескучной сборочной системочкой)
| |
|
|
|
|
1.9, бублички (?), 10:45, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +2 +/– |
просто бесценный проект - целый индус трудился и больше часа. да и новость тоже революционная. ждём hello world 2
| |
|
2.16, пох. (?), 13:29, 02/07/2019 [^] [^^] [^^^] [ответить]
| +/– |
ты просто еще зависимости не скачал - там не "целый индус", там вся его бангалорская родня в количестве 3000000 обезьян трудилась.
И еще пяток миллионов китайцев припахала за ними горшки выносить.
| |
|
3.17, бублички (?), 15:25, 02/07/2019 [^] [^^] [^^^] [ответить]
| +/– |
за 20 лет, карл! ты погляди чего наваляли! поди с нуля переписывали 80 раз (по 4 раза в год)
| |
|
4.19, пох. (?), 21:45, 02/07/2019 [^] [^^] [^^^] [ответить]
| +/– |
> поди с нуля переписывали 80 раз (по 4 раза в год)
конечно - ты ради кода в 1,5k строк (работающего банально - со строками) будешь изучать что это за нёх?
absl::StartsWithIgnoreCase() - и т д?
Полагаю, ты просто перепишешь большую часть на чем-то что либо нужно в другой работе, либо просто уже знаешь.
Вот и следующий копчоный то же самое сделает.
| |
|
|
|
1.10, Аноним (10), 11:28, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| –2 +/– |
>содержащих правила (REP, Robots Exclusion Protocol) для исключения контента из области индексации ботами поисковых систем
РКН обяжет всех поисковиков к обязательному использованию. А правилами исключения захочет рулить самостоятельно.
| |
1.11, Аноним (11), 11:28, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +3 +/– |
Building the library
Bazel is the official build system for the library
расходимся, ребята - чтобы собрать "библиотеку" из ЦЕЛОГО ОДНОГО файла - как обычно у гугля, нужно себе нескучных зондопрограмм понаставить пару терабайт.
| |
|
2.18, Аноним (18), 17:37, 02/07/2019 [^] [^^] [^^^] [ответить]
| –2 +/– |
О, эксперты-любители автокрапа подъехали? Его то уж точно не пара терабайт, да?
| |
|
1.13, YetAnotherOnanym (ok), 11:45, 02/07/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– |
Осталась мелочь - догадаться, что сам Гугл вовсе не обязательно использует этот парсер в том виде, в каком он опубликован, но уж всяко хочет, чтобы мы верили, что используемый им парсер именно такой.
| |
|
2.15, пох. (?), 13:27, 02/07/2019 [^] [^^] [^^^] [ответить]
| +/– |
ты хочешь сказать, что моя строчка с dissalow: / все же не будет им обрабатываться "правильно"?
да ну, не может быть!
| |
|
|