
Czyścimy dane!
Otrzymaliśmy ostatnio zlecenie sprawdzenia jakości bazy danych klientów - czy tacy klienci nadal istnieją, czy ich dane są poprawne, czy adresy są prawdziwe. Przechodząc przez ten proces zauważyliśmy kilka rzeczy którymi chcielibyśmy się z Wami podzielić.
Najskuteczniejszą sposobem na czystą wodę jest niedopuszcznie do zanieczyszczenia źródla wody. Wlewanie tam gnojówki i filtrowanie jej powoduje koszty, marnuje cenną energię a woda ciągle nie jest idealna. Ta prosta prawda ciągle jest eureką w większości firm.
80% cennego czasu analityk spędza na wyszukiwaniu, czyszczeniu i organizowaniu danych, pozostawiając tylko 20% na faktyczną analizę.
Różnego rodzaju badania pokazują że pracownicy, we wszystkich działach firmy, marnują wiele cennego czasu na poprawianie danych i nie do końca ufają analizom wykonanym na ich podstawie.

Drukowanie paragonów fiskalnych przez API
Integracja drukarki fiskalnej z danym oprogramowaniem wymaga napisania modułu obsługującego komunikację między urządzeniem fiskalnym a oprogramowaniem. Wysyłanie stosownych komend do drukarki fiskalnej zgodnych z protokołem obsługującym dany model drukarki wymaga sporego wysiłku programistycznego.
Każdy producent urządzeń fiskalnych używa swojeg protokołu który obsługuje tylko urządzenia tego producenta. Co więcej, jeśli protokół zmieni się, np. z powodu przepisów fiskalnych, wymaga to wprowadzenia na czas zmian. Czy można jednak odseparować komunikację z drukarką fiskalną od systemu sprzedażowego (ERP lub innego), tak by taki system wysyłał tylko dane samych transakcji klientów? Tak, można.

W poszukiwaniu sobowtóra
Zazwyczaj wiemy co kupują nasi obecni klienci. Jakie artykuły kupili, kiedy je kupili, jakie kategorie kupują najczęściej, jakiej wartości były to zakupy. Jednak dużo trudniej znaleźć odpowiedź co mogli by jeszcze od nas kupić. Najczęstszą próbą poszukiwania odpowiedzi na to pytanie jest segmentacja/klasyfikacja klientów; klienci o podobnych cechach mają zbliżone potrzeby zakupowe.
Ale może istnieje lepszy sposób na zbudowanie modelu wzorcowego klienta? Czy możemy znaleźć sobowtóra naszego klienta który kupuje to samo i podpowie co jeszcze ponad to? Spróbujmy go odnaleźć.

Poglądy są jak pępki – każdy ma swój
Większość firm chce wiedzieć, co mówią o nich klienci, ale nikt nie ma czasu na przeczytanie 1000 odpowiedzi na ankietę lub tylu recenzji produktu. Zamiast tego oczekujemy krótkiego podsumowania. Najczęściej przy ocenie produktu widzimy ranking gwiazdek – im produkt lepszy, tym więcej ich otrzymuje. Ale gwiazdki nie powiedzą nam co w tym produkcie klienci cenią najbardziej, co najmniej.
Tradycyjne techniki Natural Language Processing polegają na zliczaniu wystąpień danych słów lub wyrażeń w tekście. Często tekst poddany zostaje analizie „machine learning” i „training” co jest niczym innym jak raczej prymitywną, siłową metoda klasyfikowania tekstu na podstawie wcześniej odpowiednio sklasyfikowanego materiału.