Open Source ETL framework

Меня попросили прототип двух схем ETL. Требования следующие:

  • Открытый исходный код
  • Доступно для Linux
  • Поддержка
  • Журналы можно просматривать в веб-браузере (приятно иметь)
  • Написано в Perl, Python, Ruby или Java

Необработанный файл может быть любым (excel, csv, html-страница и т. Д.). Целевой базой данных является MySQL.

Не просто отбрасывайте имена, пожалуйста, укажите преимущества / недостатки, основанные на вашем опыте.

Благодаря!

  • Python Vs. Ruby для метапрограммирования
  • Python эквивалент Ruby's 'method_missing'
  • Как открыть (чтение-запись) или создать файл с усечением?
  • тесты: у python есть более быстрый способ перехода в сетевую папку?
  • Как стать продуктивным с помощью Vim / Emacs
  • Как написать программу Perl, Python или Ruby для изменения памяти другого процесса в Windows?
  • Распечатайте вывод os.popen () без буферизации в python
  • Отладка языка сценариев, такого как ruby
  • 3 Solutions collect form web for “Open Source ETL framework”

    Я использовал Чайник . Он имеет свой собственный графический интерфейс, но если вы предпочитаете использовать API для самостоятельной работы с ETL, он также поддерживается. Это оказалось очень полезным для меня, и есть несколько плагинов, которые уже доступны для него.

    Одним из самых популярных ETL на базе Java будет Talend .

    Jaspersoft ETL – еще один, расширенный от Talend и имеющий хороший пользовательский интерфейс на основе eclipse.

    Другим вариантом является CloverETL . Он написан на Java и существует версия LGPL с открытым исходным кодом. Кроме того, у него есть бесплатная версия графического интерфейса CloverETL Community.

    Он может обрабатывать любой из указанных источников и подключается к нескольким базам данных, включая MySQL.

    Python - лучший язык программирования в мире.