Koniec drugiego tygodnia stycznia przynosi ważne doniesienia z dziedziny zastosowań AI w medycynie – dwa przełomowe badania pokazują, jak sztuczna inteligencja może pomóc w walce z rakiem. Jednocześnie obserwujemy postęp w dziedzinie samej technologii AI – naukowcy z Uniwersytetu w Bonn opracowali nową metodę trenowania sieci neuronowych, która może znacząco zmniejszyć zużycie energii przez systemy AI. A Chat GPT dostał nową funkcję.
Ale zanim przejdziemy do bieżących wiadomości informacja na temat warsztatu „Efektywne korzystanie z Claude’a„: miejsca skończyły się dziś rano.
A teraz wiadomości – poczynając od moim zdaniem najważniejszych.
🧠 Titans: Google Research przedstawia nowe podejście do pamięci w modelach AI
Zespół Google Research zaprezentował innowacyjne podejście do projektowania modeli językowych zdolnych do adaptacji w czasie rzeczywistym – nazwane Titans. System wprowadza nowy rodzaj pamięci neuronowej, która potrafi samodzielnie uczyć się zapamiętywania informacji podczas działania, a nie tylko w trakcie treningu.
Kluczową innowacją jest mechanizm „zaskoczenia” – model przywiązuje większą wagę do nieoczekiwanych lub istotnych informacji, podobnie jak robi to ludzki mózg. Dodatkowo, system potrafi „zapominać” nieistotne informacje, co pozwala mu efektywnie zarządzać swoją pamięcią przy długich sekwencjach tekstu. Architektura zawiera trzy komponenty: pamięć krótkoterminową (oparta na mechanizmie uwagi), pamięć długoterminową (ucząca się podczas działania) oraz pamięć trwałą (przechowującą wiedzę niezależną od danych).
W testach Titans wykazał znaczącą przewagę nad istniejącymi modelami, zarówno w zadaniach językowych jak i w analizie długich sekwencji, np. przy wyszukiwaniu konkretnych informacji w obszernych dokumentach. Co szczególnie interesujące, architektura okazała się również efektywna w zadaniach z zakresu analizy DNA i prognozowania szeregów czasowych.
To bardzo obiecujące rozwiązanie pokazuje, że wciąż możemy znacząco usprawnić podstawową architekturę modeli językowych. Wprowadzenie mechanizmów inspirowanych ludzką pamięcią – takich jak selektywne zapamiętywanie czy zapominanie – może być kluczem do stworzenia systemów AI lepiej radzących sobie z długimi kontekstami.
🧠 Sakana AI prezentuje Transformer2 – model AI zdolny do dynamicznej adaptacji
Sakana AI zaprezentowało przełomową technologię o nazwie Transformer2 (Transformer-squared), która wprowadza koncepcję samodostosowujących się modeli językowych (LLM). System wykorzystuje dwuetapowe podejście, które pozwala modelom AI na dostosowywanie swoich parametrów do różnych zadań w czasie rzeczywistym. Zamiast tworzenia osobnych wersji modelu dla każdego zadania, Transformer2 używa innowacyjnej techniki SVF (Singular Value Fine-tuning), która modyfikuje tylko wartości osobliwe w macierzach wag modelu, zapewniając minimalny narzut obliczeniowy.
Model oferuje trzy metody adaptacji: opartą na promptach, wykorzystującą klasyfikator zadań oraz uczenie few-shot. W testach system znacząco przewyższył tradycyjne metody dostrajania takie jak LoRA, szczególnie w złożonych zadaniach matematycznych i wizualnych. Co szczególnie interesujące, badania pokazały możliwość skutecznego przenoszenia wiedzy między różnymi modelami (np. z Llama do Mistral), otwierając nowe możliwości w rozwoju i skalowaniu modeli AI.
To bardzo obiecujące rozwiązanie z praktycznego punktu widzenia – zamiast tworzenia i przechowywania wielu wyspecjalizowanych modeli, możemy mieć jeden model, który dynamicznie adaptuje się do potrzeb. To nie tylko oszczędność zasobów, ale też krok w kierunku bardziej elastycznej i efektywnej sztucznej inteligencji.
🔬 AI wykrywa przerzuty raka mózgu bez operacji
Zespół badawczy z McGill University opracował model AI, który z 85-procentową dokładnością wykrywa rozprzestrzenianie się przerzutów nowotworowych w mózgu, analizując standardowe obrazy MRI. To przełom, który może uchronić pacjentów przed inwazyjnymi zabiegami chirurgicznymi dotychczas niezbędnymi do oceny stopnia zaawansowania choroby. Model został przetestowany na ponad 130 pacjentach i zweryfikowany poprzez porównanie z wynikami badań mikroskopowych.
🩺 Nowy test krwi wspierany przez AI wykrywa wiele rodzajów raka
Naukowcy z Uniwersytetu Oxford stworzyli innowacyjny test krwi TriOx, który wykorzystuje uczenie maszynowe do analizy DNA we krwi pacjentów. Test potrafi wykryć sześć różnych typów nowotworów, w tym raka jelita grubego, przełyku, trzustki, nerek, jajników i piersi, nawet we wczesnych stadiach. Co istotne, test osiąga wysoką skuteczność – 94,9% czułości i 88,8% specyficzności, co oznacza małe ryzyko zarówno fałszywych wyników pozytywnych jak i negatywnych.
🔋 Przełom w uczeniu sieci neuronowych obniży zużycie energii przez AI
Naukowcy z Uniwersytetu w Bonn opracowali nową metodę trenowania „spiking neural networks”, która może drastycznie zmniejszyć zużycie energii przez systemy AI. Te specjalne sieci neuronowe naśladują naturalne neurony, komunikując się poprzez krótkie impulsy elektryczne zamiast ciągłego przepływu danych. Dotychczas trudno było je trenować, ale nowa metoda rozwiązuje ten problem, otwierając drogę do znacznie bardziej energooszczędnych systemów AI.
🚀 OpenAI wprowadza funkcję zarządzania zadaniami w ChatGPT
OpenAI uruchomiło nową funkcję „Tasks” w wersji beta, dostępną dla użytkowników planów Plus, Team i Pro. Nowa funkcjonalność pozwala na planowanie i automatyzację powtarzalnych zadań, takich jak codzienne aktualizacje pogody czy przypomnienia o ważnych wydarzeniach. System może wysyłać powiadomienia na różne platformy, choć zarządzanie zadaniami jest obecnie ograniczone do wersji webowej.
🔍 Nowy system GeAR ulepsza wyszukiwanie dokumentów
Nowy system GeAR (Generation Augmented Retrieval) wprowadza innowacyjne podejście do wyszukiwania dokumentów, łącząc tradycyjne metody z możliwościami generatywnymi AI. System nie tylko znajduje odpowiednie dokumenty, ale także potrafi wskazać konkretne fragmenty i wytłumaczyć ich znaczenie. W testach osiąga imponujące wyniki: 0,961 Recall@5 i 0,903 MAP@5 w zadaniach wyszukiwania informacji.
Czytaj więcej lub Czytaj artykuł źródłowy
Co jeszcze w świecie AI?
- Microsoft powołał nową wewnętrzną organizację CoreAI skupiającą się na rozwoju narzędzi AI dla programistów. Czytaj więcej
- MiniMax udostępnił model open source z kontekstem 4 milionów tokenów, co stanowi znaczący przełom w dziedzinie długich kontekstów. Czytaj więcej
- Microsoft usuwa listę oczekujących na dostęp do GitHub Copilot Workspace, otwierając narzędzie dla wszystkich użytkowników. Czytaj więcej Cursor i inni zmuszają do szybszego tempa…
- Nowy model Mistral AI do generowania kodu, Codestral 25.01, wykazuje znaczącą przewagę w benchmarkach. Czytaj więcej
- Apple dołącza do konsorcjum UALink, aby wspierać rozwój wydajności klastrów AI nowej generacji. Czytaj więcej
Dodaj komentarz