Snowflake łączy siły z Meta, aby hostować i optymalizować nową flagową rodzinę modeli LLM w Snowflake Cortex AI.

Szczegóły: Kategoria: IT Solutions; Utworzono: 25 lipiec 2024

Snowflake ogłosił, że będzie hostować zestaw wielojęzycznych dużych modeli językowych (LLM) open source Llama 3.1 w Snowflake Cortex AI. Będą one dostępne dla przedsiębiorstw w celu łatwego budowania i wykorzystania aplikacji AI o dużej skali. Wspólna oferta obejmuje największy i najbardziej zaawansowany duży model językowy firmy Meta, Llama 3.1 405B wraz ze stosem systemowym open source stworzonym przez Snowflake. Umożliwia ona wnioskowanie w czasie rzeczywistym o dużej przepustowości, w celu tworzenia potężnych aplikacji do przetwarzania i generowania języka naturalnego.

	REKLAMA

Zespół badawczy Snowflake AI zoptymalizował Llama 3.1 405B zarówno na potrzeby wnioskowania, jak i dostrajania, wspierając potężne okno kontekstowe 128K. Jednocześnie umożliwia wnioskowanie w czasie rzeczywistym z opóźnieniem end-to-end, do 3 razy niższym i przepustowością 1,4 razy wyższą, niż istniejące rozwiązania open source. Ponadto, pozwala na dostrajanie potężnego modelu przy użyciu zaledwie jednego węzła GPU, eliminując koszty i poziom złożoności dla deweloperów i użytkowników. W ramach współpracy z Meta, Snowflake zapewnia klientom łatwe, wydajne i zaufane metody płynnego dostępu, dostrajania i wdrażania najnowszych modeli Meta w chmurze danych AI, z kompleksowym podejściem do zaufania i bezpieczeństwa.

Światowej klasy zespół badawczy AI firmy Snowflake wytycza nową ścieżkę dla przedsiębiorstw i społeczności open source w zakresie wykorzystania najnowocześniejszych modeli otwartych, takich jak Llama 3.1 405B, do wnioskowania i dostrajania w sposób maksymalizujący efektywność” - podkreśla Vivek Raghunathan, wiceprezes ds. inżynierii AI w Snowflake. „Dostarczamy naszym klientom nie tylko najnowocześniejsze modele Meta bezpośrednio poprzez Snowflake Cortex AI, ale także wyposażamy przedsiębiorstwa i społeczność AI w nowe badania i kod open source, który wspiera okna kontekstowe 128K, wnioskowanie wielowęzłowe, równoległość potoków, kwantyzację 8-bitową i wiele więcej, by rozwijać AI na potrzeby szerszego ekosystemu”.

Zespół Snowflake ds. badań nad sztuczną inteligencją osiąga najszybsze i najbardziej efektywne pod względem pamięci rozwiązania open source do inferencji i dostrajania modeli

Zespół Snowflake zajmujący się badaniami nad sztuczną inteligencją rozwija innowacje open source dzięki aktywnemu zaangażowaniu w społeczność AI oraz transparentności w budowaniu najnowocześniejszych technologii LLM. Wraz z premierą Llama 3.1 405B, zespół Snowflake ds. badań nad sztuczną inteligencją udostępnia swój stos optymalizacji (Optimization Stack) systemu wnioskowania i dopasowywania dużych modeli językowych (LLM) we współpracy z DeepSpeed, Hugging Face, vLLM oraz społecznością AI. To przełomowe osiągnięcie ustanawia nowy standard dla systemów inferencji i dostrajania open source dla modeli z wieloma setkami miliardów parametrów.

Potężna skala modelu i wymagania dotyczące pamięci stanowią istotne wyzwania dla użytkowników, którzy dążą do osiągnięcia niskiego poziomu opóźnień przy wnioskowaniu w czasie rzeczywistym o wysokiej przepustowości. Celem jest zwiększenie opłacalności oraz długoterminowe wsparcie kontekstowe dla różnych zastosowań generatywnej sztucznej inteligencji klasy korporacyjnej. Wymagania dotyczące pamięci do przechowywania stanów modelu i aktywacji sprawiają, że dostrajanie jest niezwykle trudne, ponieważ duże klastry GPU potrzebne do dopasowania stanów modelu podczas treningu są często niedostępne dla osób zajmujących się danymi.

System optymalizacji masowego wnioskowania i dostrajania dużych modeli językowych (LLM) firmy Snowflake rozwiązuje te wyzwania. Dzięki zastosowaniu zaawansowanych technik równoległości i optymalizacji pamięci, Snowflake umożliwia szybkie i wydajne przetwarzanie AI bez potrzeby korzystania ze skomplikowanej i kosztownej infrastruktury. Dla Llama 3.1 405B stos systemowy Snowflake zapewnia wydajność w czasie rzeczywistym i wysoką przepustowość na zaledwie jednym węźle GPU oraz obsługuje ogromne okna kontekstowe 128K w konfiguracjach wielowęzłowych. Ta elastyczność obejmuje zarówno sprzęt nowej generacji, jak i starsze urządzenia, co sprawia, że jest dostępna dla szerszego grona firm. Ponadto naukowcy zajmujący się danymi mogą dostrajać Llama 3.1 405B za pomocą technik mieszanej precyzji na mniejszej liczbie GPU, eliminując potrzebę dużych klastrów GPU. W rezultacie organizacje mogą łatwo, efektywnie i bezpiecznie dostosowywać i wdrażać potężne aplikacje generatywnej AI klasy korporacyjnej.

Zespół badawczy AI Snowflake opracował również zoptymalizowaną infrastrukturę do dostrajania, obejmującą destylację modelu, mechanizmy ochronne, generowanie wspomagane wyszukiwaniem (RAG) oraz generowanie danych syntetycznych, aby przedsiębiorstwa mogły łatwo rozpocząć korzystanie z tych use case’ów w ramach Cortex AI.

Snowflake Cortex AI umacnia zaangażowanie w zakresie dostarczania godnej zaufania, odpowiedzialnej sztucznej inteligencji

Bezpieczeństwo AI jest najwyższym priorytetem dla Snowflake oraz klientów firmy. W związku z tym, Snowflake udostępnia Snowflake Cortex Guard w wersji ogólnodostępnej, w celu dalszej ochrony przed szkodliwymi treściami dla każdego modelu LLM lub zasobu stworzonego w Cortex AI — korzystając z najnowszych modeli Meta lub LLM-ów dostępnych od innych czołowych dostawców, takich jak AI21 Labs, Google, Mistral AI, Reka oraz samego Snowflake. Cortex Guard wykorzystuje Llama Guard 2 od Meta, co jeszcze bardziej ułatwia przedsiębiorstwom korzystanie z zaufanej sztucznej inteligencji. Dzięki temu mogą mieć pewność, że używane przez nich modele są bezpieczne.

Jako lider w branży hotelarskiej, polegamy na generatywnej sztucznej inteligencji, aby dogłębnie zrozumieć i kwantyfikować kluczowe tematy w naszym systemie Voice of the Customer. Uzyskanie dostępu do wiodących w branży modeli Llama firmy Meta w ramach Snowflake Cortex AI umożliwia nam jeszcze lepsze analizowanie naszych danych i uzyskiwanie niezbędnych informacji potrzebnych do rozwoju biznesu” – mówi Dave Lindley, Sr. Director of Data Products w E15 Group. „Cieszymy się, że mamy możliwość dostrajania i testowania modelu Llama, aby podejmować działania w czasie rzeczywistym w oparciu o opinie naszych gości.

Bezpieczeństwo i zaufanie są kluczowe dla biznesu, gdy chodzi o wykorzystanie generatywnej sztucznej inteligencji. Snowflake daje nam pewność, której potrzebujemy, aby wprowadzać innowacje i wykorzystywać wiodące w branży duże modele językowe na szeroką skalę” – powiedział Ryan Klapper, lider obszaru AI w Hakkoda. „Połączenie modeli Llama od Meta w ramach Snowflake Cortex AI otwiera przed nami jeszcze więcej możliwości obsługi wewnętrznych aplikacji opartych na RAG (generowanie wspomagane wyszukiwaniem). Te aplikacje umożliwiają naszym interesariuszom płynne interakcje z kompleksowymi wewnętrznymi bazami wiedzy, zapewniając im dostęp do dokładnych i istotnych informacji zawsze wtedy, gdy tego potrzebują.

Dzięki wykorzystaniu modeli Llama firmy Meta w ramach Snowflake Cortex AI, dajemy naszym klientom dostęp do najnowszych otwartych modeli językowych (LLM)” – powiedział Matthew Scullion, CEO i współzałożyciel Matillion. „Nadchodząca Llama 3.1 daje naszemu zespołowi i użytkownikom jeszcze większy wybór i elastyczność w dostępie do dużych modeli językowych, które najlepiej odpowiadają ich potrzebom, oraz utrzymanie się na czele innowacji w dziedzinie AI. Llama 3.1 w ramach Snowflake Cortex AI będzie dostępny natychmiast wraz z premierą Matillion na platformie Snowflake.

Jako lider w obszarze zaangażowania klientów oraz platform zarządzania ich danymi, Twilio zapewnia im dostęp do odpowiednich danych, aby mogli tworzyć właściwe komunikaty dla odpowiednich odbiorców we właściwym czasie” - mówi Kevin Niparko, wiceprezes ds. strategii produktowej i technologicznej w Twilio Segment. „Możliwość wyboru odpowiedniego modelu dla konkretnego przypadku użycia w ramach Snowflake Cortex AI umożliwia naszym wspólnym klientom generowanie inteligentnych, opartych na AI wniosków oraz łatwe wdrażanie ich w narzędziach końcowych. W erze szybkiej ewolucji, firmy muszą szybko wprowadzać kolejne iteracje na zunifikowanych zestawach danych, aby osiągać najlepsze wyniki.

Źródło: Snowflake

IT Solutions
05-09-24
Powszechne stosowanie generatywnej sztucznej inteligencji w biznesie, poziom inwestycji oraz oparte na niej innowacje mogą zadecydować o gospodarczej pozycji krajów i regionów na arenie międzynarodowej. SAS, globalny lider w dziedzinie danych i AI, postanowił sprawdzić aktualny układ sił w tym obszarze.
Czytaj więcej...

IT Solutions
05-09-24
W 2024 roku międzynarodowa firma doradcza Cushman & Wakefield ogłosiła bliską współpracę z Microsoft w celu wdrożenia zaawansowanego zestawu rozwiązań sztucznej inteligencji (AI). Jest to element nowej strategii transformacji cyfrowej AI+ firmy, mającej na celu rozwój sektora nieruchomości komercyjnych (CRE), umożliwiając stosowanie AI na dużą skalę przy jednoczesnym doskonaleniu operacji, dostaw dla klientów i zarządzania danymi.
Czytaj więcej...

IT Solutions
02-09-24
Zebra Technologies Corporation poinformowała o integracji zaawansowanych funkcji sztucznej inteligencji z oprogramowaniem Aurora do wizyjnego przetwarzania obrazu. Nowe możliwości obejmują wykorzystanie uczenia głębokiego, co znacząco usprawni obsługę złożonych scenariuszy inspekcji wizualnej.
Czytaj więcej...

IT Solutions
28-08-24
Z raportu "The Transformational Opportunity of AI on ICT Jobs" wynika, że ponad 90 procent stanowisk w sektorze ICT doświadczy znaczących zmian z powodu AI. Pracownicy na średnich i podstawowych szczeblach, szczególnie w zarządzaniu, projektowaniu UX oraz testowaniu i jakości IT, muszą przygotować się na drastyczne zmiany.
Czytaj więcej...

IT Solutions
28-08-24
Globalnie rynek IT czekają nowości w obszarze AI. Każdy dostawca i duży gracz na rynku obiecuje rozwój tej technologii. Dużo namiesza zapewne Google. Chodzi o jego nowy komputer kwantowy, który według zapowiedzi ma moc 70 kubitów i jest 241 milionów razy szybszy, od tradycyjnego superkomputera. Połączone możliwości większych mocy obliczeniowych i AI będą ogromne.
Czytaj więcej...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Pozyskaj Dotacje na ERP: DIG.IT i inne programy dla MŚP

IX Europejski Kongres Lean Management 2024

VI FORUM RETAIL CHALLENGE POLAND 2025

Wdrożenie ERP enova3...

Wdrożenie SYSTEMU MA...

PRZECZYTAJ RÓWNIEŻ:

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Feerum SA z systemem...

Impuls EVO w Selfa G...

Pozyskaj Dotacje na ERP: DIG.IT i inne programy dla MŚP

IX Europejski Kongres Lean Management 2024

VI FORUM RETAIL CHALLENGE POLAND 2025

Wdrożenie ERP enova3...

Wdrożenie SYSTEMU MA...

Wdrożenie ERP enova3...

Wdrożenie SYSTEMU MA...

15 lat z Symfonią –...

Novita S.A. z system...

Poznajcie nas: Sieć...

Comarch ERP XL otwie...

ERP Impuls EVO w Ced...

IT Solutions
27-08-24
Sektor ubezpieczeniowy znajduje się ostatnio w trudnej sytuacji. Pandemia, szalejąca inflacja, a także zmiany klimatyczne powodujące coraz częstsze klęski żywiołowe zagrażają rentowności ubezpieczycieli.
Czytaj więcej...

IT Solutions
23-08-24
Generatywna Sztuczna Inteligencja (Gen AI) zyskuje na znaczeniu jako kluczowy element strategii rozwoju firm. Z badania Deloitte wynika, że aż 67 proc. przedsiębiorstw, które wdrożyły tę technologię, odnotowało wyraźne korzyści. Jednak wiele z nich wciąż zmaga się z wyzwaniami w przekształcaniu eksperymentów w skalowalne rozwiązania. Problemem są dane.
Czytaj więcej...

IT Solutions
13-08-24
takich jak susze i powodzie. Wzrost globalnych temperatur powoduje intensyfikację parowania, co z kolei prowadzi do dłuższych i bardziej dotkliwych okresów suszy. Jednocześnie przyczynia się do bardziej gwałtownych i intensywnych opadów, które wywołują powodzie. Według danych ONZ, do 2050 roku aż 5 miliardów ludzi na świecie doświadczy niedoborów wody, co podkreśla skalę tego problemu. W odpowiedzi na te wyzwania, firma SAS wprowadza rozwiązania oparte na analityce i sztucznej inteligencji, które mogą znacząco poprawić zarządzanie wodą zarówno w firmach, jak i sektorze publicznym.
Czytaj więcej...

IT Solutions
05-08-24
W celu skutecznego wdrażania najnowocześniejszych rozwiązań technologicznych konieczne są zespoły kompetentnych ekspertów i ekspertek. Doskonale widać to na przykładzie GenAI. Aż 88% firm podkreśla rosnącą potrzebę zaawansowanej wiedzy technicznej, niezbędnej do integracji danych, optymalizacji modeli, rozwijania przypadków użycia oraz dalszego rozwoju aplikacji.
Czytaj więcej...

IT Solutions
30-07-24
89% firm zmaga się z trudnościami w przygotowaniu danych Po ponad 18 miesiącach od hucznej premiery ChatGPT oraz rosnącej oferty produktów, rozwiązań i usług opartych na Gen AI, firmy odkrywają, że wdrożenia tych narzędzi są trudniejsze, a korzyści mniejsze niż oczekiwano. Tylko 22% organizacji efektywnie wykorzystuje tę technologię we wszystkich aspektach swojej działalności. Mimo to entuzjazm wobec Gen AI nie słabnie, a wielu liderów biznesowych nadal widzi w niej klucz do przyszłości i rewolucji w sposobie prowadzenia firm. Na jakie bariery napotykają firmy, które chcą zmieniać się z GenAI?
Czytaj więcej...