Ostatnie dni przyniosły nam prawdziwy wysyp nowości od największych graczy w świecie AI. OpenAI dodało do ChatGPT możliwość rozpoznawania i analizowania obrazów w czasie rzeczywistym, Google zaprezentowało Gemini 2.0 wraz z kilkoma innymi projektami wykorzystującymi agentów AI, a Anthropic wprowadził do użytku swój najszybszy model – Claude 3.5 Haiku. Do tego Meta szykuje się do premiery nowej Llamy.
Zanim przyjrzymy się tym newsom to coś ode nas: Andy nagrał tutorial pokazujący jak używać Claude 3.5 Sonnet z aplikacją desktopową z rozszerzeniami jako programistę. Własny programista za $18 miesięcznie (tyle kosztuje dostęp Pro do Claude) to moim zdaniem niezły deal mimo tego, że wielkiego projektu ze skomplikowanym UI nie zbuduje.
🔍 Gemini 2.0 wprowadza nową erę AI od Google
Google zaprezentowało kolejną wersję swojego flagowego modelu AI wraz z całą serią nowych projektów. Gemini 2.0 Flash to szybszy i bardziej wydajny model, który dorównuje wydajnością większym wersjom przy zachowaniu wysokiej prędkości działania. Nowy model oferuje wyjątkowe możliwości multimodalne, w tym generowanie dźwięku w czasie rzeczywistym. Szczególnie interesujący jest tryb Deep Research, który pozwala na kompleksową analizę setek stron internetowych i tworzenie szczegółowych raportów. Google przedstawiło również projekty wykorzystujące agentów AI: Projekt Astra (asystent głosowy nowej generacji), Projekt Mariner (agent do nawigacji po przeglądarce) oraz Jules (asystent do kodowania).
👀 ChatGPT zyskuje wzrok – nowe możliwości widzenia w czasie rzeczywistym
OpenAI wprowadziło długo oczekiwaną funkcję analizy obrazu w czasie rzeczywistym do ChatGPT. Advanced Voice Mode z funkcją widzenia pozwala użytkownikom kierować kamerę telefonu na obiekty i otrzymywać natychmiastowe odpowiedzi i analizy. System potrafi także analizować zawartość ekranu, pomagając w nawigacji po ustawieniach czy rozwiązywaniu problemów matematycznych. Funkcja jest dostępna dla subskrybentów ChatGPT Plus, Team i Pro, a jej wdrażanie rozpoczęło się w tym tygodniu. Dodatkowo, z okazji świąt, OpenAI dodało tryb „Santa”, pozwalający na rozmowy z AI używającym głosu Świętego Mikołaja.
⚡ Claude 3.5 Haiku – najszybszy model AI od Anthropic
Anthropic udostępnił szerokiemu gronu użytkowników model Claude 3.5 Haiku, który był wcześniej dostępny tylko przez API. Model wyróżnia się wyjątkową szybkością działania i dorównuje, a czasem przewyższa wydajnością większy model Claude 3 Opus, szczególnie w zadaniach związanych z programowaniem i przetwarzaniem danych. Model oferuje kontekst do 200 000 tokenów, co jest imponującym wynikiem w porównaniu do konkurencji. Haiku jest teraz dostępny dla wszystkich użytkowników Claude, z darmowym dostępem w ramach limitów dziennych oraz rozszerzonym dostępem dla subskrybentów Pro.
🎮 Google tworzy system Android XR dla rzeczywistości rozszerzonej
Google przedstawiło Android XR, nowy system operacyjny przeznaczony dla urządzeń AR/VR. Stworzony we współpracy z Samsungiem i Qualcommem, system ma na celu uczynienie interakcji z technologią bardziej naturalną dzięki wykorzystaniu sztucznej inteligencji. Platforma wykorzystuje asystenta Gemini i umożliwia płynne przełączanie się między środowiskiem wirtualnym a rzeczywistym. Pierwsze urządzenie, znane jako Project Moohan, ma zadebiutować w przyszłym roku.
📚 OpenAI i Microsoft finansują dataset Harvardu
Harvard University przygotowuje do udostępnienia ogromną kolekcję blisko miliona książek z domeny publicznej, które będą mogły służyć do trenowania modeli AI. Projekt, finansowany przez OpenAI i Microsoft, ma na celu demokratyzację dostępu do wysokiej jakości danych treningowych. Kolekcja zawiera klasykę literatury oraz teksty specjalistyczne w różnych językach, co ma pomóc mniejszym firmom i indywidualnym badaczom w rozwoju własnych modeli AI.
Co jeszcze w świecie AI?
- Character.AI wprowadza nowe zabezpieczenia dla nastolatków, w tym oddzielny model AI i kontrolę rodzicielską. Czytaj więcej
- Amazon Prime Video wprowadza funkcję „AI Topics” wykorzystującą uczenie maszynowe do grupowania i rekomendowania treści. Czytaj więcej
- Lambda Labs uruchamia API do wnioskowania AI, oferując najniższe ceny na rynku. Czytaj więcej
- Reddit wprowadza funkcję „Reddit Answers” wykorzystującą AI do podsumowywania dyskusji. Czytaj więcej
- Nvidia zwiększa zatrudnienie w Chinach o ponad 1000 pracowników, koncentrując się na technologii autonomicznej jazdy. Czytaj więcej
- Stanford proponuje globalną inicjatywę stworzenia wirtualnej komórki przy pomocy AI. Czytaj więcej
Dodaj komentarz