Czy AI może wykorzystywać dane bez narażania prywatności?

Szczegóły: Kategoria: BEZPIECZEŃSTWO IT; Utworzono: 12 styczeń 2023

Inteligentne produkty i usługi muszą znaleźć równowagę między rozwojem a ochroną prywatności użytkowników. Bezpieczeństwo danych jest coraz ważniejsze w obliczu rosnącego znaczenia sztucznej inteligencji. Dzięki obecnym możliwościom, nawet dane anonimowe mogą być poddawane analizie w celu identyfikacji osób i uzyskania informacji o ich prywatności, jak to zostało ujawnione przez Netflix w 2006 roku. Jakie są nowoczesne rozwiązania tego problemu?

	REKLAMA

Aby stworzyć i wyszkolić systemy oparte na sztucznej inteligencji, potrzebne jest udostępnienie olbrzymiej ilości danych przez użytkowników. Urządzenia medyczne rejestrują dane dotyczące takie jak tętno, dieta, genetyka czy historia terapii. Inteligentne urządzenia domowe zbierają informacje o codziennych czynnościach jakie wykonujemy w naszych domach. Natomiast systemy wspomagające jazdę zbierają informacje o położeniu, stylie jazdy i przekraczaniu ograniczeń prędkości.

Te dane mogą być wrażliwe, dlatego stosuje się anonimizację w celu ich ochrony. Jednak pojawia się problem, gdy potrzeba deanonimizacji jest konieczna do skutecznego trenowania modeli, które są podstawą inteligentnych produktów. To może prowadzić do ujawnienia prywatnych informacji oraz do utraty lub kradzieży danych. Kompromis w zakresie ich udostępniania jest trudny, ponieważ im lepsze i precyzyjniejsze modele, tym więcej danych jest potrzebnych, co zwiększa ryzyko dla prywatności. Z drugiej strony, im więcej informacji posiadają eksperci i im więcej różnych ekspertów jest zaangażowanych, tym więcej wartości mogą one potencjalnie przynieść.

Ten kompromis jest często przedstawiany jako „możemy prowadzić analizę danych lub zachować prywatność, ale nie jedno i drugie”. Nie zawsze jednak trzeba dokonywać tego wyboru. To dlatego, że małe, skoncentrowane zespoły mogą bezpiecznie pracować stosując nowoczesne rozwiązania i metody posługiwania się danymi w procesach uczenia maszynowego, obliczeń lub analizy danych. Oczywiście im więcej danych jest udostępnianych, tym większa potencjalna korzyść i jednocześnie większe ryzyko – mówi Edward Gołda, Data Protection Officer w Capgemini Polska.

Nowe rozwiązania chroniące prywatność

Zasady ochrony prywatności są surowe, a użytkownicy inteligentnych narzędzi nie chcą aby ich zaufanie było wystawione na próbę. Firma Deepmind przekonała się o tym w 2017 roku. Aplikacja Streams, wykorzystująca dane brytyjskiego narodowego funduszu zdrowia, zajmowała się szacowaniem ryzyka ostrego uszkodzenia nerek u wybranych pacjentów. Jednak podczas tworzenia aplikacji firmie nielegalnie udostępniono dokumentację medyczną 1,6 miliona pacjentów, nie poddając jej anonimizacji. To narzędzie, które mogło ratować życie, zostało ostatecznie wycofane, ponieważ podczas wykorzystywania danych osobowych do tworzenia inteligentnego produktu zupełnie pominięto kwestię ochrony prywatności. Przy udostępnianiu bazy danych pacjentów, można było zastosować dostępne sposoby wykorzystania danych do tworzenia AI, chroniące prywatność użytkowników. Stosując te nowoczesne metody podczas przekazywania informacji firmie, możliwe było uniknięcie opisanego problemu. Dziś istnieje już cała gama rozwiązań, które sprawdzają się w tym zakresie. Jakie to rozwiązania?

Uczenie federacyjne: trenowanie modelu na danych przechowywanych na wielu urządzeniach lub serwerach. Taki model uczy się bez usuwania danych z urządzenia lub tworzenia ich kopii. Można to traktować jako „dzielenie się modelem, a nie danymi” oraz tworzenie globalnego systemu, który uczy się od lokalnych.

Bezpieczne obliczenia wielostronne: umożliwiają wielu stronom (instytucjom czy badaczom) pracę nad danymi, których nie chcą całkowicie odsłaniać. Zaszyfrowane informacje są udostępniane między uzgodnionym zestawem osób, co umożliwia pracę na zbiorze składającym się z prywatnych danych wszystkich stron, ale bez wglądu we wrażliwe informacje.

Szyfrowanie homomorficzne, czyli przetwarzanie danych zaszyfrowanych. Umożliwiłoby to np. znalezienie danych o osobach cierpiących na artretyzm bazując na informacjach z urządzeń technologicznych do noszenia (jak np. opaski mierzące parametry organizmu), przeprowadzenie na nich obliczeń i stworzenie modelu opartego o dane całej badanej grupy, bez odszyfrowywania danych poszczególnych osób.

Zaufane środowisko wykonawcze: funkcja sprzętowa, tworząca bezpieczny obszar na urządzeniu, które może samodzielnie wykonywać określone zatwierdzone funkcje (np. nasze smartfony używają ich do uwierzytelniania biometrycznego). Można je skonfigurować do uruchamiania modeli AI na prywatnych danych bez dostępu do tych informacji przez kogokolwiek.

Prywatność różnicowa: dodaje do danych losowy szum, który „psuje” punkty danych, ale zachowuje właściwości całego zestawu. Znając typ losowości, nadal można stworzyć dokładny obraz na poziomie grupy. Ale gdyby ktoś ukradł te dane, to nie określi, czy jakikolwiek indywidualny zapis jest dokładny.

Jak technologie chroniące prywatność wyglądają w praktyce?

Metody te zaczynają być wykorzystywane coraz powszechniej w odkrywaniu leków czy choćby spisach powszechnych. Laboratorium UN PETS (technologie zwiększające prywatność) testuje szereg powyższych rozwiązań, aby umożliwić krajowym urzędom statystycznym, naukowcom i firmom współpracę w zakresie wspólnych danych. Mimo to, ścieżka nie jest prosta. Technologie chroniące prywatność wiążą się z kompromisami. Dostępne techniki często wymagają zaawansowanych obliczeń. Zasłaniając dane celem ochrony prywatności, w niektórych przypadkach tracimy dokładność. Żadna technika nie jest idealna. Zachowanie prywatności będzie wymagało kompromisów i łączenia oraz mieszania technologii dla każdego przypadku.

Technologie chroniące prywatność nie powinny być dodatkiem, ale podstawową częścią projektu. Każdy proces, który musi udostępniać prywatne dane, powinien opierać się przede wszystkim na ich ochronie. Technologie chroniące prywatność, wdrażane od pierwszych chwil, mogą pomóc przekonać klientów i znaleźć kompromis między poszanowaniem prywatności a maksymalizacją dostępu do użytecznych informacji. Technologie zwiększające prywatność, w tym różnicowa prywatność, federacyjne uczenie się i szyfrowanie homomorficzne są oczywiście trudne do wdrożenia, ale wyspecjalizowane firmy takie, jak Capgemini, pomagają klientom w tym zakresie – dodaje Edward Gołda.

Oczywistym celem jest lepsze wykorzystanie danych, które jako społeczeństwo gromadzimy. Szersze, głębsze i bardziej reprezentatywne dane pozwalają tworzyć dokładniejsze, dające się uogólnić, użyteczne modele. Te z kolei stanowią podstawę inteligentnych i spersonalizowanych produktów i usług. Wdrożenie nowych modeli może być trudne i kosztowne, ale oznacza to ochronę i poszanowanie prywatności osób, które udostępniają swoje dane, a w konsekwencji – pozwala na postęp technologiczny i budowę inteligentnych rozwiązań usprawniających życie i funkcjonowanie społeczeństwa.

Źródło: Capgemini

BEZPIECZEŃSTWO IT
17-04-24
W epoce cyfrowej, gdzie przechowywanie danych w chmurze staje się coraz bardziej popularne, bezpieczeństwo danych staje się priorytetem. Zagrożenia cybernetyczne, w tym ataki typu zero-day, stanowią realne ryzyko dla przedsiębiorstw i użytkowników prywatnych. Jednak dzięki zaawansowanym technologiom antywirusowym możliwe jest skuteczne zapewnienie bezpieczeństwa danych w środowiskach chmurowych.
Czytaj więcej...

BEZPIECZEŃSTWO IT
09-04-24
W erze cyfrowej transformacji sektora finansowego zapewnienie cyberbezpieczeństwa jest kluczowym wyzwaniem dla instytucji działających w tej branży. Unia Europejska, dążąc do wzmocnienia odporności operacyjnej w cyfrowym wymiarze, wprowadziła regulacje, które mają na celu zwiększenie bezpieczeństwa cyfrowego w finansach.
Czytaj więcej...

BEZPIECZEŃSTWO IT
08-04-24
Duże modele językowe (LLM) rewolucjonizują sposób, w jaki wchodzimy w interakcję z technologią. W rezultacie dostawcy SaaS, walcząc o przewagę konkurencyjną, oferują przedsiębiorstwom narzędzia AI, takie jak analitykę sprzedaży lub asystentów kodowania. Jak jednak zabezpieczać usługi oparte o sztuczną inteligencję?
Czytaj więcej...

BEZPIECZEŃSTWO IT
22-03-24
Powierzchnia cyberataków stale rośnie, cyberprzestępczość coraz bardziej się profesjonalizuje, konieczna jest optymalizacja zasobów. W odpowiedzi na te wyzwania firma WithSecure opracowała rozwiązanie umożliwiające przedsiębiorstwom rozszerzenie modelu cyberbezpieczeństwa uwzględniając proaktywną walidację zagrożeń obok reaktywnego reagowania na incydenty. Partnerzy WithSecure mogą otrzymać wcześniejszy, wyłączny dostęp do inteligentnej technologii zarządzania ryzykiem.
Czytaj więcej...

BEZPIECZEŃSTWO IT
21-03-24
26% firm ankietowanych w badaniu Veeam Data Protection Trends Report 2024 zadeklarowało, że w ciągu ostatniego roku padło ofiarą incydentów ransomware co najmniej cztery razy. Prawie dziewięć na dziesięć przedsiębiorstw w sytuacji awaryjnej nie jest w stanie z powodzeniem odzyskać danych. Firmy coraz częściej dostrzegają, że prowadzą biznes w warunkach wysokiego ryzyka i każdego dnia mogą zostać zaatakowane przez przestępców. Zdecydowana większość zapowiada chęć zwiększenia budżetów na ochronę danych.
Czytaj więcej...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Konferencja: Comarch Letnie Premiery

Webinar: Jak wykorzystać rozwiązania Microsoft w branży tworzyw sztucznych?

Konferencja: Dynamics 365. Kierunek: AI

Digitalizacja Whiske...

Cyfryzacja bez ryzyk...

PRZECZYTAJ RÓWNIEŻ:

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Konferencja: Comarch Letnie Premiery

Webinar: Jak wykorzystać rozwiązania Microsoft w branży tworzyw sztucznych?

Konferencja: Dynamics 365. Kierunek: AI

Digitalizacja Whiske...

Cyfryzacja bez ryzyk...

Digitalizacja Whiske...

Cyfryzacja bez ryzyk...

Automatyzacja proces...

Zautomatyzowany maga...

Wyższa efektywność o...

Dragon: produkcja ch...

Rozwój sztucznej int...

BEZPIECZEŃSTWO IT
07-03-24
Dbasz o to, żeby numer Twojego dowodu nie dostał się w niepowołane ręce, prawda? A co z numerem identyfikującym Twój komputer? Niestety, cyberprzestępcy mogą go zdobyć, nie pytając o zgodę. Adres protokołu internetowego (w skrócie adres IP) jest to unikalny ciąg znaków, który identyfikuje komputer w sieci. Każdy adres IP jest unikalny i zawiera ważne informacje jak np. przybliżona lokalizacja komputera. Wynika to z faktu, że aby komputer mógł komunikować się online, musi być rozpoznawalny dla innych komputerów. Wyobraź sobie internet jako chatroom, w którym wszyscy użytkownicy używają unikalnych pseudonimów do wysyłania sobie wiadomości - właśnie tak to działa.
Czytaj więcej...

BEZPIECZEŃSTWO IT
06-03-24
Rozwój technologii cyfrowych wnosi znaczące zmiany do wielu sektorów gospodarki, w tym także dla sektora transportu. Jednakże, wraz z korzyściami płynącymi z cyfryzacji, pojawiają się również nowe wyzwania – zwłaszcza związane z cyberbezpieczeństwem.
Czytaj więcej...

BEZPIECZEŃSTWO IT
21-02-24
Aż 90% dyrektorów finansowych planuje w 2024 roku zwiększyć nakłady na technologie AI (Gartner). Jednocześnie, eksperci od cyber-obrony zastanawiają się jaki wpływ na bezpieczeństwo będą miały algorytmy w perspektywie kilku lat wprzód. Przeczytaj analizę Palo Alto Networks i dowiedz się, w jakim kierunku zmierzają wdrożenia sztucznej inteligencji w cyberbezpieczeństwie.
Czytaj więcej...

BEZPIECZEŃSTWO IT
15-02-24
Firmy chętnie korzystają z aplikacji chmurowych ze względu na koszty i wygodę. Niestety, często nie widzą zagrożeń, jakie niesie ze sobą ten model usługowy.
Czytaj więcej...

BEZPIECZEŃSTWO IT
08-02-24
Według najnowszych danych aż 55,7% firm w Polsce korzysta z technologii chmurowej. To o ponad 10 punktów procentowych powyżej średniej w Unii Europejskiej. Czy jednak wszystkie z nich wiedzą jak zapewnić bezpieczeństwo swoim danym przechowywane w chmurze? Eksperci ESET podpowiadają jakich błędów unikać.
Czytaj więcej...