Przejdź do głównej treści

Big data jak młotek - Wonga.com

Katgoria: BUSINESS INTELLIGENCE / Utworzono: 25 marzec 2014

BIG DATA jak młotek - Wonga.com

MAM STARTUPJak znaleźć złotą rybę w oceanie danych? Czy ich analiza zawsze przynosi korzyści? O wykorzystaniu BIG DATA w biznesie rozmawia Adam Łopusiewicz  (mamstartup.pl) z Marcinem Borowieckim, Dyrektorem Zarządzającym wonga.com.


REKLAMA
ASSECO KSEF
 
Proszę powiedzieć jakie korzyści przynosi big data w firmie?
Big data w usługach finansowych przynosi przede wszystkim korzyści dla klienta, które wynikają z tego, że zleceniobiorca jest w stanie podjąć decyzję w sposób automatyczny, obiektywny i natychmiastowy. Sprawia to, że w sektorze, w którym klient poszukuje finansowania i zależy mu na tym, żeby fundusze otrzymać w ciągu kilku minut, dzięki analizie dużych zbiorów danych jesteśmy w stanie szybciej ocenić jego zdolność kredytową. Fakt, że korzystamy z kilku tysięcy punktów danych, pomaga podejmować lepsze decyzje.

Wonga.com dawniej korzystała w Wielkiej Brytanii ze scoringu [wyznaczników - przyp. red.] FICO, który jest udostępniany przez biura kredytowe. Okazało się, że w naszym sektorze system ten nie jest tak przewidujący, jak własne modele oparte o analizę danych z różnych źródeł. Dlatego Wonga zaczęła dołączać coraz szerszy zakres danych do analizy, co pozwoliło na podejmowanie dużo lepszych decyzji. Dzięki temu też spłacalność pożyczek w wonga.com jest lepsza od bankowych kredytów konsumenckich.
Jak od strony firmy big data pomaga w rozwoju?
W naszym konkretnym przypadku dzieje się to na dwa sposoby. Pierwszy to używanie różnych danych z wielu źródeł. Dzięki temu częściej pożyczamy pieniądze osobom, które są w stanie je spłacić, co oznacza, że efektywnie wykorzystujemy własny kapitał. Drugi element dotyczy automatyzacji procesu, na który możemy sobie pozwolić. Wonga nie zatrudnia analityków kredytowych – zatrudniamy informatyków i analityków danych. Nasz polski zespół składający się z kilkunastu osób udziela prawie tylu samych pożyczek, co średniej wielkości bank. To pokazuje zupełnie inny i bardziej efektywny model biznesowy oparty o pełną automatyzację. W Anglii w ciągu ostatnich lat Wonga udzieliła dzięki temu około ośmiu milionów pożyczek, przy zespole liczącym łącznie sto osób.
System popełnia mniej błędów niż człowiek? Co gdyby Wonga, zamiast systemu analiz, zatrudniła analityków, którzy mieliby “ręcznie” analizować pozyskane dane?
 
To byłoby wręcz niemożliwie. Analizowanie tak różnorodnych danych z wielu źródeł byłoby trudne do zrobienia, nawet przez duży zespół analityków. Wykorzystanie tych wszystkich danych ze źródeł (np. biura informacji gospodarczej i kredytowej) i innych tradycyjnych danych oraz sprawdzanie, jak się klient na stronie zachowuje, ma spore znaczenie. Na tej podstawie budujemy profil konsumenta złożony z kilku tysięcy punktów danych, który automatycznie jest przepuszczany przez nasz algorytm.

Czy istnieją jakieś zagrożenia korzystania z big data?

Istnieje cała seria regulacji dotycząca ochrony danych osobowych, odpowiednich zgód. To ważny aspekt, który trzeba mieć zawsze na względzie, gdy chcemy zbierać w internecie jakiekolwiek dane.

Dużym ryzykiem przy analizach big data jest coś, co nazywa się „overfitem”. Polega ono na tym, że jakieś dane nam się sprawdzają i wydaje się, że jakieś czynniki są w stanie przewidzieć pewne zdarzenie. Prawda jest jednak taka, że jeżeli wpuszcza się kilka tysięcy tych czynników, to coś na pewno się skoreluje, natomiast niekoniecznie będzie to przydatne do prognozowania. Ważne żeby mieć stały dopływ tych obserwacji, czyli w naszym przypadku klientów, by te hipotezy i modele nieustannie testować.

Podobno w Stanach Zjednoczonych odkryto, że poziom wody w którymś z jezior jest skorelowany z indeksem giełdy nowojorskiej. Jeśli dostatecznie dużo danych objaśniających weźmie się pod uwagę, to na pewno jakieś dane skorelują się. Pytanie tylko, czy taki model jest w ogóle przydatny biznesowo i czy można go używać do przewidywania przyszłości?

Czy zawsze big data przynosi korzyści?

Big data służy jako pomocnik w podejmowaniu decyzji. Takie decyzje mogą dotyczyć kredytów, ale też kierunku budżetów marketingowych, prognozy pogody, inwestycji na giełdzie czy diagnozy medycznej. Te wszystkie decyzje można podjąć wyłącznie opierając się na analizie dużych zbiorów danych. To taki trochę suwak, gdzie na jednej stronie jest podejmowanie decyzji wyłącznie w oparciu o analizie danych, a na drugiej ocena ekspercka. Analiza danych pozwala na automatyzację i obniżenie jednostkowego kosztu decyzji, ale nie wszędzie sprawdzi się lepiej od decyzji eksperckiej. W medycynie np. potrzebna jest dodatkowa, pogłębiona opinia eksperta.

Są jednak takie obszary, jak fundusze inwestycyjne, którymi wyłącznie komputer steruje i podejmuje decyzje o inwestowaniu w dane akcje. Często nawet, w naszym sektorze, w 100% oddajemy decyzję algorytmowi, ale te algorytmy cały czas doskonalimy. Są firmy, które mają mocne podejście do analityki kredytowej. To, co daje big data, to możliwość skalowania tych decyzji.

Jeśli coś, co w segmencie mikropożyczek ma duże znaczenie, to to, że koszt pojedynczej decyzji jest mikroskopijny. Jeśli ktoś daje kredyt na budowanie nowego statku w stoczni, to nie potrzebna będzie mu analiza big data, tylko osoba, która zna się na tym i podejmie dobrą decyzję w sprawie powierzenia pieniędzy. Big data to jest taki młotek, który trzeba do dobrego gwoździa przyłożyć.

Wspomniał pan, że na tę chwilę, w medycynie nie przyda się big data…

… myślę, że dużo zmieni się w medycynie jeśli chodzi o analizę danych – np. wraz z coraz niższym kosztem sekwencjonowania DNA i popularyzacją przenośnych urządzeń pomiarowych – zbiory łatwo dostępnych danych bardzo szybko się powiększają. Pracownicy szpitala mogliby zbierać informacje o pacjentach i analizować je, jeszcze przed pojawieniem się go w budynku. Lekarze mogliby testować hipotezy, które w długim okresie mogłyby być przydatne w diagnozach.

Obecnie w jakich sektorach, oprócz tego finansowego, najbardziej przydaje się analiza danych big data?

Myślę, że coraz większe zastosowanie ma w reklamie i w sprzedaży. W wykorzystywaniu danych o użytkownikach do lepszego targetowania reklamy. Tworzeniu programów lojalnościowych obejmujących wiele marek. Prognozy pogody są obierane za pomocą big data, inwestycje również. To przykłady, które przychodzą mi pierwsze na myśl.

Pracował pan wcześniej m.in. w eBay’u i dużo czasu spędził w Dolinie Krzemowej. Od kiedy wykorzystuje się tam big data?

Myślę, że w marketingu i reklamie zawsze próbowano konsumenta śledzić łącząc dane z wielu źródeł. Nie jestem w stanie powiedzieć, że istniał taki jeden moment, który można określić jako początek wykorzystywania big data. Analitykę danych stosowano jednak i 10 lat temu, zanim hasło „big data” zaistniało w sferze publicznej. W tym czasie możliwości pozyskiwania danych rosły, a wraz z nimi rozwijały się algorytmy i pomysły na ich wykorzystanie.

Big data bada dane zawarte w internecie, banki to robią i Wonga też. Nie zawsze jednak te dane zamieszczane w internecie są prawdziwe. Czy pana zdaniem niebawem jeszcze łatwiej będzie oszukać instytucje, czy wręcz przeciwnie?

To jest kwestia testowania tych modeli. Oczywiście, można próbować te dane fałszować w internecie, dlatego one są często porównywane z innymi źródłami. Nigdy też nie jest tak, że jakaś dana w izolacji jest decydująca w podjęciu decyzji. O ile sama decyzja jest podejmowania automatycznie, o tyle stworzenie modelu jej podejmowania w oparciu o wiedzę ekspercką i pracę wielu analityków. Oni zastanawiają się nad każdą zmienną i nad tym, na ile można na niej polegać. Skąd się te zmienne bierze?

Na poziomie każdej zmiennej, która wchodzi do modelu, zadajemy sobie pytanie: jakie jest to źródło informacji? Zakładamy również, że ono może nie być prawdziwe. Oprócz modelowania zjawiska tego czy klient poradzi sobie ze spłatą pożyczki, staramy się modelować, czy klient jest tym, za kogo się podaje. Zjawisko wyłudzania czy kradzieży tożsamości w internecie niestety istnieje i tego typu modele pozwalają się zabezpieczać przed nim.

Może pan podać przykład porównywania takich danych? Jak to wygląda w wonga.com?

Są różne sposoby. Większość z nich to taki nasz przepis na coca-colę, którego nie zdradzamy. Często ta sama informacja pojawia się w różnych miejscach. To, co użytkownik podaje to jedno, a drugie to to, co pojawia się w publicznie dostępnych bazach danych. Badamy, jak podane informacje mają się względem rozkładu czy segmentu klientów, który jest przewidziany w modelu. Trochę to bazuje na prawdopodobieństwach, ale jest to skuteczne.

Wysokie koszty, niedocenienie analiz i brak czasu - to trzy powody, dla których nie warto analizować big data w naszej firmie. Czy na przykładzie wonga.com można stwierdzić, że analiza danych użytkownika opłaca się?

To jest kwestia modelu, jaki się wybiera: można oprzeć go o decyzje algorytmiczne albo o decyzje ludzi. Na samym początku może warto opierać je na decyzjach ludzi i dopiero, gdy produkt się przyjmie, zacząć opierać je bardziej na analizie danych.

W fazie startupu, żeby zacząć analizować duże ilości danych, trzeba najpierw mieć ich zbiór. Na początku, zazwyczaj, nie ma się użytkowników i nie ma jak weryfikować naszych tez czy modeli. Bez danych i użytkowników to jest trudne. Kilka lat temu wonga.com również zaczynała jako startup i też polegała na zewnętrznym scoringu, a nie na własnym algorytmie big data.

Przydatność big data zależy od tego, gdzie chcemy to narzędzie przełożyć, jakie decyzje chcemy wspierać w oparciu o analizę danych. Nie sztuką jest zebrać pięć tysięcy zmiennych na temat użytkownika, który do mnie przychodzi, jak tych użytkowników jest tylko stu. Przy tak małej liczbie nie sposób zbudować poprawnego modelu decyzyjnego.

Pierwszą trudnością po podjęciu decyzji o analizie big data jest właśnie zebranie danych?

Tak, big data to narzędzie do podejmowania decyzji. Dla młodej organizacji lepszym rozwiązaniem będzie podejmowanie decyzji przez człowieka, uczenie się danych, które przychodzą i tego jak je zastosować oraz zaczęcie budowania skali. Dopiero później warto, aby ta organizacja zaczęła bardziej przesuwać się w stronę zautomatyzowania procesu decyzji.

Co jest potrzebne do analizy takich danych?

Może to oczywiste, ale przede wszystkim dane. Dlatego ważna jest możliwość zbierania i przechowywania danych – zarówno techniczna jak i prawna. Ostatni element to analitycy danych, a także cały proces ciągłego budowania modeli i ich testowania – rzadko jest to jednorazowe zadanie

Jakie dane na przykładzie Wonga.com nie sprawdziły się i nie są potrzebne do uwiarygodnienia potencjalnego klienta?

Bardzo wiele zmiennych, które analizujemy w danym momencie „nie sprawdza się”. Ale na tym polega właśnie proces ciągłej analizy – im więcej mamy klientów, im bardziej zmienia się istniejąca populacja – te same zmienne mogą okazać się istotne.

Autor: Adam Łopusiewiczb
Źródło: http://mamstartup.pl/wywiady/5140/big-data-jak-mlotek-wonga-com


Najnowsze wiadomości

Kwantowy przełom w cyberochronie - nadchodząca dekada przepisze zasady szyfrowania na nowo
Przez długi czas cyfrowe bezpieczeństwo opierało się na prostym założeniu: współczesne komputery potrzebowałyby ogromnych zasobów i wielu lat, aby złamać silne algorytmy szyfrowania. Rozwój technologii kwantowej zaczyna jednak tę regułę podważać, a eksperci przewidują, że w perspektywie 5–10 lat może nadejść „dzień zero”. Jest to moment, w którym zaawansowana maszyna kwantowa będzie w stanie przełamać większość aktualnie stosowanych zabezpieczeń kryptograficznych w czasie liczonym nie w latach, lecz w godzinach.
PSI prezentuje nową identyfikację wizualną
psilogoW ramach realizowanej strategii transformacji PSI Software SE zaprezentowała nową identyfikację wizualną. Odświeżony wizerunek w spójny sposób oddaje technologiczne zaawansowanie firmy, jej głęboką wiedzę branżową oraz silne ukierunkowanie na potrzeby klientów. Zmiany te wzmacniają pozycję PSI jako innowacyjnego lidera technologicznego w obszarze skalowalnych rozwiązań informatycznych opartych na sztucznej inteligencji i chmurze, rozwijanych z myślą o energetyce i przemyśle.
PROMAG S.A. rozpoczyna wdrożenie systemu ERP IFS Cloud we współpracy z L-Systems
PROMAG S.A., lider w obszarze intralogistyki, rozpoczął wdrożenie systemu ERP IFS Cloud, który ma wesprzeć dalszy rozwój firmy oraz integrację kluczowych procesów biznesowych. Projekt realizowany jest we współpracy z firmą L-Systems i obejmuje m.in. obszary finansów, produkcji, logistyki, projektów oraz serwisu, odpowiadając na rosnącą skalę i złożoność realizowanych przedsięwzięć.
F5 rozszerza portfolio bezpieczeństwa o narzędzia do ochrony systemów AI w środowiskach enterprise
F5 ogłosiło wprowadzenie dwóch nowych rozwiązań - F5 AI Guardrails oraz F5 AI Red Team - które mają odpowiedzieć na jedno z kluczowych wyzwań współczesnych organizacji: bezpieczne wdrażanie i eksploatację systemów sztucznej inteligencji na dużą skalę. Nowa oferta łączy ochronę działania modeli AI w czasie rzeczywistym z ofensy
Snowflake + OpenAI: AI bliżej biznesu
Snowflake przyspiesza wykorzystanie danych i sztucznej inteligencji w firmach, przenosząc AI z fazy eksperymentów do codziennych procesów biznesowych. Nowe rozwiązania w ramach AI Data Cloud integrują modele AI bezpośrednio z danymi, narzędziami deweloperskimi i warstwą semantyczną. Partnerstwo z OpenAI, agent Cortex Code, Semantic View Autopilot oraz rozwój Snowflake Postgres pokazują, jak budować skalowalne, bezpieczne i mierzalne wdrożenia AI w skali całej organizacji.



Najnowsze artykuły

Magazyn bez błędów? Sprawdź, jak system WMS zmienia codzienność logistyki
SENTEWspółczesna logistyka wymaga nie tylko szybkości działania, lecz także maksymalnej precyzji – to właśnie te czynniki coraz częściej decydują o przewadze konkurencyjnej firm. Nawet drobne pomyłki w ewidencji stanów magazynowych, błędy przy przyjmowaniu dostaw czy nieprawidłowe rozmieszczenie towarów, mogą skutkować poważnymi stratami finansowymi i opóźnieniami w realizacji zamówień. W jaki sposób nowoczesne rozwiązania do zarządzania pomagają unikać takich sytuacji? Czym właściwie różni się tradycyjny system magazynowy od zaawansowanych rozwiązań klasy WMS (ang. Warehouse Management System)? I w jaki sposób inteligentne zarządzanie procesami magazynowymi realnie usprawnia codzienną pracę setek firm?
Migracja z SAP ECC na S4 HANA: Ryzyka, korzyści i alternatywne rozwiązania
W ostatnich latach wiele firm, które korzystają z systemu SAP ECC (Enterprise Central Component), stoi przed decyzją o przejściu na nowszą wersję — SAP S4 HANA. W obliczu końca wsparcia dla ECC w 2030 roku, temat ten staje się coraz bardziej aktualny. Przemiany technologiczne oraz rosnące oczekiwania związane z integracją nowych funkcji, jak sztuczna inteligencja (AI), skłaniają do refleksji nad tym, czy warto podjąć tak dużą zmianę w architekturze systemu. Przyjrzyjmy się głównym powodom, dla których firmy rozważają migrację do S4 HANA, ale także argumentom,  które mogą przemawiać za pozostaniem przy dotychczasowym systemie ECC, przynajmniej na krótki okres.
Jak maksymalizować zyski z MTO i MTS dzięki BPSC ERP?
BPSC FORTERROZysk przedsiębiorstwa produkcyjnego zależy nie tylko od wydajności maszyn, ale przede wszystkim od precyzyjnego planowania, realnych danych i umiejętnego zarządzania procesami. Dlatego firmy, które chcą skutecznie działać zarówno w modelu Make to Stock (MTS), jak i Make to Order (MTO), coraz częściej sięgają po rozwiązania klasy ERP, takie jak BPSC ERP.
Ponad połowa cyberataków zaczyna się od błędu człowieka
Ponad 2/3 firm w Polsce odnotowała w zeszłym roku co najmniej 1 incydent naruszenia bezpieczeństwa . Według danych Unit 42, zespołu analitycznego Palo Alto Networks, aż 60% ataków rozpoczyna się od działań wymierzonych w pracowników – najczęściej pod postacią phishingu i innych form inżynierii społecznej . To pokazuje, że w systemie ochrony organizacji pracownicy są kluczowym ogniwem – i że firmy muszą nie tylko edukować, ale też konsekwentnie egzekwować zasady cyberhigieny. Warto o tym pamiętać szczególnie teraz, w październiku, gdy obchodzimy Europejski Miesiąc Cyberbezpieczeństwa.
MES - holistyczne zarządzanie produkcją
Nowoczesna produkcja wymaga precyzji, szybkości i pełnej kontroli nad przebiegiem procesów. Rosnąca złożoność zleceń oraz presja kosztowa sprawiają, że ręczne raportowanie i intuicyjne zarządzanie coraz częściej okazują się niewystarczające. Firmy szukają rozwiązań, które umożliwiają im widzenie produkcji „na żywo”, a nie z opóźnieniem kilku godzin czy dni. W tym kontekście kluczową rolę odgrywają narzędzia, które porządkują informacje i pozwalają reagować natychmiast, zamiast po fakcie.

Przeczytaj Również

Jak przyspieszyć transformację energetyczną i dekarbonizację dzięki inteligentnej integracji danych w chmurze?

Odpowiedzią jest Snowflake Energy Solutions – nowa oferta łącząca ponad 30 rozwiązań partnerskich w… / Czytaj więcej

Jak skutecznie wdrożyć Power BI w organizacji?

Wdrożenie narzędzi analitycznych w firmie to nie tylko kwestia technologii, ale także zmiany podejś… / Czytaj więcej

Czy systemy Business Intelligence nadają się do małych i średnich firm?

W świecie biznesu coraz więcej mówi się o danych. Firmy gromadzą je w ogromnych ilościach – od arku… / Czytaj więcej

Jak Business Intelligence rewolucjonizuje zarządzanie sieciami dealerskimi – rozwiązania od One Support

W branży motoryzacyjnej zmiany zachodzą szybciej niż kiedykolwiek. Dynamiczne wahania cen, rosnąca… / Czytaj więcej

Narzędzia BI dla systemów ERP: Jak wybrać odpowiednie rozwiązanie?

W ostatnim czasie dane stały się jednym z najważniejszych aktywów biznesowych. Sam system ERP pozwa… / Czytaj więcej

Business Intelligence w praktyce – jak system BI One zmienia sposób zarządzania firmą

W erze cyfrowej transformacji dane stały się najcenniejszym zasobem każdej organizacji. Ich skutecz… / Czytaj więcej