Французский интегратор, работающий в области открытого ПО, в понедельник объявил о выходе под открытой лицензией дата-профайлера собственной разработки. В опубликованном заявлении компания отметила, что это первый открытый продукт такого рода, и что он должен позволить организациям проводить более качественный анализ, проверку и профилирование данных без необходимости приобретения проприетарного ПО.
Профилирование — это эмпирический анализ определенного массива данных, основанный на анализе частоты распределения аномальных факторов и тенденций их повторения. Так, например, при работе с данными, пользователь может выявлять области, имеющие схожую структуру и отличающиеся только в незначительных деталях, или более серьезные отклонения, которые могут привести к конфликтным ситуациям. При обработке корреспонденции это может быть неполный адрес или пропущенный индекс. С другой стороны, незначительно измененный адрес может повлечь повторное отправление информации одному и тому же клиенту.
Вице-президент по маркетингу компании Talend сказал, что необходимость в открытом профайлере была продиктована потребностями рынка, на котором сейчас доминируют проприетарные разработки. Это решение позволяет с одной стороны осуществлять более легкую модификацию и настройку кода под конкретные нужды, и с другой — дает возможность компаниям, не имеющим бюджета на ПО данного типа, оценить практическую пользу от внедрения профилирования данных и свой бизнес.
В дальнейших планах компании вывести профайлер на уровень лучших в своем классе проприетарных разработок. Загрузить профайлер можно с сайта компании.
|