1.5, Аноним (5), 23:52, 05/08/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +5 +/– |
> большими наборами данных (десятки гигабайт)
Сейчас на дворе точно 2019-й, а не 2000-й?
| |
|
|
3.13, anonymous (??), 07:30, 06/08/2019 [^] [^^] [^^^] [ответить]
| +8 +/– |
Десятки гигабайт для СУБД -- это действительно не так много в наше время. В аналитические СУБД обычно загоняют много терабайт.
| |
|
4.17, лютый жабист__ (?), 08:56, 06/08/2019 [^] [^^] [^^^] [ответить]
| +1 +/– |
>В аналитические СУБД обычно загоняют много терабайт.
По ссылкам не ходил, но полагаю, что SQL там убогий и это поделие никак задачи Орацле подхватить не смогёт.
А десятки терабайт сейчас обычно грузят в хламоэластики от хламо-IOT или просто журналы. Васянская бигдата без обработки и агрегирования, ценность данных меньше, чем у коллекции порнухи... :)
| |
|
5.22, Аноним (22), 09:28, 06/08/2019 [^] [^^] [^^^] [ответить]
| +3 +/– |
бигдейта начинается тогда, когда вы не можете ни за какие деньги купить сервер, в память которого вместятся данные, которые надо держать там для обработки. Поэтому сравнивать spark - решение для кластера - с blazingsql - решением для отдельной машины - некорректно. Разумеется Hadoop-based решения будут медленнее. Зато они прожуют такой объём данных, на котором обычные базы поперхнутся.
| |
|
6.45, лютый жабист__ (?), 07:32, 08/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
>бигдейта начинается тогда, когда вы не можете ни за какие деньги купить сервер, в память которого вместятся данные
В какую из памятей/памятёв? :) Спарк это больше про ОЗУ, Хадуп больше про сторадж.
Например одиночный сервер спланк с полкой на 100 терабайт это ещё не бигдата по меркам анонимусов опеннета? :)))
| |
|
|
|
5.21, Аноним (21), 09:28, 06/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
Она, похоже, не питон. Про питон, судя по всему, автор новости от себя добавил. На питоне только какая-то демонстрашка выложена. Впрочем, будут ли байндинги под что-то полезное, ещё большой вопрос...
| |
|
4.19, Аноним (19), 09:00, 06/08/2019 [^] [^^] [^^^] [ответить]
| –1 +/– |
Сотни гигабайт. Терабайты мб у гугла или у какого-то сбера, но на таких объёмах и своё можно запилить.
| |
|
5.24, Аноним (-), 09:44, 06/08/2019 [^] [^^] [^^^] [ответить]
| –1 +/– |
> на таких объёмах и своё можно запилить.
Чтобы что-то пилить, нужно, чтобы программисты толковые были. Откуда они у Сбера? Если только речь не про Ignite.
| |
5.25, Аноним (5), 10:06, 06/08/2019 [^] [^^] [^^^] [ответить]
| +4 +/– |
Это перепись админов локалхоста, что ли?
У гугла экзабайты, у сбера петабайты, десятки терабайт - даже у средне-мелких контор.
Размер БД менее 1 Тб сейчас - обычный hello word, не о чем говорить.
| |
|
|
7.41, Аноним (5), 18:38, 06/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
Я спецом так написал из гуманных соображений, чтобы админам локалхоста было до чего докопаться.
| |
|
|
|
|
3.28, пох. (?), 10:41, 06/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
коллекция-то тоже побогаче "десятков" нынче будет - что это за порнуха, не в 4k ?
| |
3.38, ыы (?), 15:53, 06/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
Речь идет не о БД как таковой, а о
"данных (десятки гигабайт), хранимых в табличных форматах (например, логи, статистика NetFlow и т.п.). "
Что сейчас с одной стороны- реально, а с другой- обычно в б_О_льших объемах и не существует.
Единичный лог на десяток гигов? Легко. Больше? Вы что ротацию логам не делаете вообще? Гнать вас в шею... Поэтому рассуждения про экзабайты баз данных (и про базы данных вообще) - они просто от невнимательного чтения и непонимания проблемы.
| |
|
4.40, пох. (?), 17:45, 06/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
> "данных (десятки гигабайт), хранимых в табличных форматах (например, логи, статистика
> NetFlow и т.п.). "
хм, а зачем вы логи храните в "табличных форматах"?!
> Что сейчас с одной стороны- реально, а с другой- обычно в б_О_льших
> объемах и не существует.
Яровая и товарищмайор уже идут к вам! Несут расширятель хранимой емкости - очень почему-то похожий на бутылку, так что на всякий случай - запаситесь вазелином.
> Единичный лог на десяток гигов? Легко. Больше? Вы что ротацию логам не
> делаете вообще? Гнать вас в шею...
делают (более того, единичный лог на десяток гигов - это вот как раз "гнать в шею"), но от этого старые логи, внезапно, не перестают быть нужны.
И эффективный поиск по ним - тоже.
> Поэтому рассуждения про экзабайты баз данных (и про базы данных вообще) - они просто от
> невнимательного чтения и непонимания проблемы.
ну авторов никто за язык на тему сравнения со spark не тянул, он вообще-то совсем не для netflow.
| |
|
5.43, Аноним (43), 11:44, 07/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
> хм, а зачем вы логи храните в "табличных форматах"?!
Так это нынче модно
| |
|
|
|
|
1.15, Аноним (15), 08:34, 06/08/2019 [ответить] [﹢﹢﹢] [ · · · ]
| –1 +/– |
> Код написан на языке Python и открыт
Какая красота, что это не правда. Что и подтверждается ссылкой https://github.com/rapidsai
Впрочем, во времена быстрой аналитики странно, что вообще ещё кто-то мыслит о том, чтобы использовать питон....
| |
|
2.16, Аноним (16), 08:51, 06/08/2019 [^] [^^] [^^^] [ответить]
| –1 +/– |
>> Код написан на языке Python и открыт
> Какая красота, что это не правда. Что и подтверждается ссылкой https://github.com/rapidsai
Речь про BlazingSQL, а вы кидайте ссылку на Rapidsai. В новости следом расписано, что BlazingSQL лишь надстройка над RAPIDSai, который понятное дело не на Python.
| |
|
|
4.27, Аноним (16), 10:28, 06/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
> https://github.com/BlazingDB - здесь написано, что они BlazingSQL. Тоже не питон
Там как раз везде написано, что Python. Первый же репозиторий "BlazingSQL is a lightweight, GPU accelerated, SQL engine built on RAPIDS. Python". Остальное левые надстройки или форки других проектов. С++ только для BlazingDB, а это совсем другой продукт.
Из Python они генерируют код для CUDA при помощи cuDF от RAPIDSai.
| |
|
5.29, Аноним (-), 10:52, 06/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
> Из Python они генерируют код для CUDA при помощи cuDF от RAPIDSai.
Жуть какая.... Ретрограды и старпёры... В 21-м веке тащить питон в реальный проект.....
| |
|
6.30, пох. (?), 11:01, 06/08/2019 [^] [^^] [^^^] [ответить]
| +/– |
да, полная фигня - в 2k19 уже давно пора было делать на node.js
| |
|
|
|
9.34, Аноним (-), 14:32, 06/08/2019 [^] [^^] [^^^] [ответить] | +/– | Для начала, разверни сервис на Свифте на каком-нибудь типовом сервере RHEL CentO... текст свёрнут, показать | |
|
|
|
|
|
|
|
|
1.35, Аноним (35), 14:57, 06/08/2019 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Пихтон, гигабайты датасета, raw хранение на сетевых дисках? Нет на них ClickHouse...
| |
|