Co się dzieje z Pentaho?

W zasadzie... nic. Wiele organizacji przez lata intensywnie inwestowało w Pentaho Data Integration (PDI). Oprogramowanie może być bezpłatne, ale czas potrzebny do zbudowania projektu w obszarze przetwarzania danych z utworzonymi setkami zadań i transformacji zdecydowanie nie jest. Niestety rozwój PDI w dużej mierze utknął w martwym punkcie. Pojawiają się nowe wersje, ale stare błędy pozostają nienaprawione, a nowa funkcjonalność jest rzadkością.

Hitachi Vantara po przejęciu Penatho w 2015 postanowili bardzo skomercjalizować oprogramowanie które przejeli. ETL nazwany Pentaho Kettle (i jego komercyjna wersja PDI) oferuje tak wiele że wiele firm nie ma motywacji by zakupić jego wersje komercyjną. Hitachi Vantara wycofuje się z Kettle i innych darmowych produktów. Wersje które powstały po zakupie przez nich Pentaho nie wniosły niczego poza zmianami numerów. Postanowili także zamknąć forum które było świetnym miejscem by poprosić o pomoc innych. Efekty tych decyzji są widoczne; popularność Pentaho Kettle spada.

Czy to oznacza że nie ma już sensu używać tego oprogramowania? Absolutnie nie. Jest wiele powodów dla których to nadal świetny ETL. Choć metody przetwarzania danch się zmieniają, powstają nowe techniki i wspierające je oprogramowanie, wiele firm nadal nie potrzebuje niczego więcej niż to co wspiera Pentaho.

Ale dla tych którzy chcą coś więcej i zastanawiają się nad nowym ETLem mamy świetną wiadomoć. Pentaho Kettle rozwija się!

Apache Hop następcą Pentaho Kettle

Grupa ludzi pod przewodnictwem człowieka legendy, Matt Casters, postanowiła zbudować nowy ETL - Apache Hop. Apache Hop zaczynał od tej samej bazy kodu, co Pentaho Data Integration (Kettle). Hop to całkowicie niezależna platforma, ale wspólna historia pozwala łatwo przejść z PDI na Hop. Hop zachowuje to, co działa w PDI: tworzenie projektów w GUI i podejście oparte na metadanych, ale ma na celu więcej:

  • Nowy interfejs użytkownika: Spoon został zastąpiony przez Hop Gui: nowy interfejs użytkownika, który pozwala nie-programistom być bardziej produktywnym niż kiedykolwiek wcześniej. Hop Gui może być używany na pulpicie lub w przeglądarce.
  • Zarządzanie cyklem życia: zarządzaj projektami i środowiskami z poziomu GUI Hop.
  • Podłączane silniki wykonawcze: zaprojektuj strumień raz, uruchom na natywnym silniku Hop lub na Apache Spark, Apache Flink lub Google Dataflow.
  • Zintegrowane testowanie: projektuj, uruchamiaj i testuj swoje przepływy pracy i strumienie bez opuszczania interfejsu GUI Hop.
  • Gotowość do DevOps: Hop jest przeznaczony do wdrożenia w dowolnym środowisku, lokalnym lub w chmurze, i integruje się z Twoim IaC, CI/CD i innymi platformami.

Wiedzę której nabyłe(a)ś pracując z Pentaho wykorzystasz w środowisku Hop. I odwrotnie, pracując z Hop bez problemu odnajdziesz się w Pentaho. Więcej o Apache Hop wkrótce. Jeśli jednak chcesz poeksperymentować z Hop już teraz, pobierz Apache Hop ze strony https://hop.apache.org/