ChatGPT zyskuje wzrok, Gemini 2.0 i Anthropic przyspieszają wyścig

Ostatnie dni przyniosły nam prawdziwy wysyp nowości od największych graczy w świecie AI. OpenAI dodało do ChatGPT możliwość rozpoznawania i analizowania obrazów w czasie rzeczywistym, Google zaprezentowało Gemini 2.0 wraz z kilkoma innymi projektami wykorzystującymi agentów AI, a Anthropic wprowadził do użytku swój najszybszy model – Claude 3.5 Haiku. Do tego Meta szykuje się do premiery nowej Llamy.

Zanim przyjrzymy się tym newsom to coś ode nas: Andy nagrał tutorial pokazujący jak używać Claude 3.5 Sonnet z aplikacją desktopową z rozszerzeniami jako programistę. Własny programista za $18 miesięcznie (tyle kosztuje dostęp Pro do Claude) to moim zdaniem niezły deal mimo tego, że wielkiego projektu ze skomplikowanym UI nie zbuduje.

🔍 Gemini 2.0 wprowadza nową erę AI od Google

Google zaprezentowało kolejną wersję swojego flagowego modelu AI wraz z całą serią nowych projektów. Gemini 2.0 Flash to szybszy i bardziej wydajny model, który dorównuje wydajnością większym wersjom przy zachowaniu wysokiej prędkości działania. Nowy model oferuje wyjątkowe możliwości multimodalne, w tym generowanie dźwięku w czasie rzeczywistym. Szczególnie interesujący jest tryb Deep Research, który pozwala na kompleksową analizę setek stron internetowych i tworzenie szczegółowych raportów. Google przedstawiło również projekty wykorzystujące agentów AI: Projekt Astra (asystent głosowy nowej generacji), Projekt Mariner (agent do nawigacji po przeglądarce) oraz Jules (asystent do kodowania).

Czytaj więcej

👀 ChatGPT zyskuje wzrok – nowe możliwości widzenia w czasie rzeczywistym

OpenAI wprowadziło długo oczekiwaną funkcję analizy obrazu w czasie rzeczywistym do ChatGPT. Advanced Voice Mode z funkcją widzenia pozwala użytkownikom kierować kamerę telefonu na obiekty i otrzymywać natychmiastowe odpowiedzi i analizy. System potrafi także analizować zawartość ekranu, pomagając w nawigacji po ustawieniach czy rozwiązywaniu problemów matematycznych. Funkcja jest dostępna dla subskrybentów ChatGPT Plus, Team i Pro, a jej wdrażanie rozpoczęło się w tym tygodniu. Dodatkowo, z okazji świąt, OpenAI dodało tryb „Santa”, pozwalający na rozmowy z AI używającym głosu Świętego Mikołaja.

Czytaj więcej

⚡ Claude 3.5 Haiku – najszybszy model AI od Anthropic

Anthropic udostępnił szerokiemu gronu użytkowników model Claude 3.5 Haiku, który był wcześniej dostępny tylko przez API. Model wyróżnia się wyjątkową szybkością działania i dorównuje, a czasem przewyższa wydajnością większy model Claude 3 Opus, szczególnie w zadaniach związanych z programowaniem i przetwarzaniem danych. Model oferuje kontekst do 200 000 tokenów, co jest imponującym wynikiem w porównaniu do konkurencji. Haiku jest teraz dostępny dla wszystkich użytkowników Claude, z darmowym dostępem w ramach limitów dziennych oraz rozszerzonym dostępem dla subskrybentów Pro.

Czytaj więcej

🎮 Google tworzy system Android XR dla rzeczywistości rozszerzonej

Google przedstawiło Android XR, nowy system operacyjny przeznaczony dla urządzeń AR/VR. Stworzony we współpracy z Samsungiem i Qualcommem, system ma na celu uczynienie interakcji z technologią bardziej naturalną dzięki wykorzystaniu sztucznej inteligencji. Platforma wykorzystuje asystenta Gemini i umożliwia płynne przełączanie się między środowiskiem wirtualnym a rzeczywistym. Pierwsze urządzenie, znane jako Project Moohan, ma zadebiutować w przyszłym roku.

Czytaj więcej

📚 OpenAI i Microsoft finansują dataset Harvardu

Harvard University przygotowuje do udostępnienia ogromną kolekcję blisko miliona książek z domeny publicznej, które będą mogły służyć do trenowania modeli AI. Projekt, finansowany przez OpenAI i Microsoft, ma na celu demokratyzację dostępu do wysokiej jakości danych treningowych. Kolekcja zawiera klasykę literatury oraz teksty specjalistyczne w różnych językach, co ma pomóc mniejszym firmom i indywidualnym badaczom w rozwoju własnych modeli AI.

Czytaj więcej

Co jeszcze w świecie AI?

Character.AI wprowadza nowe zabezpieczenia dla nastolatków, w tym oddzielny model AI i kontrolę rodzicielską. Czytaj więcej
Amazon Prime Video wprowadza funkcję „AI Topics” wykorzystującą uczenie maszynowe do grupowania i rekomendowania treści. Czytaj więcej
Lambda Labs uruchamia API do wnioskowania AI, oferując najniższe ceny na rynku. Czytaj więcej
Reddit wprowadza funkcję „Reddit Answers” wykorzystującą AI do podsumowywania dyskusji. Czytaj więcej
Nvidia zwiększa zatrudnienie w Chinach o ponad 1000 pracowników, koncentrując się na technologii autonomicznej jazdy. Czytaj więcej
Stanford proponuje globalną inicjatywę stworzenia wirtualnej komórki przy pomocy AI. Czytaj więcej

AI Sprinters