ChatGPT zyskuje wzrok, Gemini 2.0 i Anthropic przyspieszają wyścig

Ostatnie dni przyniosły nam prawdziwy wysyp nowości od największych graczy w świecie AI. OpenAI dodało do ChatGPT możliwość rozpoznawania i analizowania obrazów w czasie rzeczywistym, Google zaprezentowało Gemini 2.0 wraz z kilkoma innymi projektami wykorzystującymi agentów AI, a Anthropic wprowadził do użytku swój najszybszy model – Claude 3.5 Haiku. Do tego Meta szykuje się do premiery nowej Llamy.

Zanim przyjrzymy się tym newsom to coś ode nas: Andy nagrał tutorial pokazujący jak używać Claude 3.5 Sonnet z aplikacją desktopową z rozszerzeniami jako programistę. Własny programista za $18 miesięcznie (tyle kosztuje dostęp Pro do Claude) to moim zdaniem niezły deal mimo tego, że wielkiego projektu ze skomplikowanym UI nie zbuduje.

🔍 Gemini 2.0 wprowadza nową erę AI od Google

Google zaprezentowało kolejną wersję swojego flagowego modelu AI wraz z całą serią nowych projektów. Gemini 2.0 Flash to szybszy i bardziej wydajny model, który dorównuje wydajnością większym wersjom przy zachowaniu wysokiej prędkości działania. Nowy model oferuje wyjątkowe możliwości multimodalne, w tym generowanie dźwięku w czasie rzeczywistym. Szczególnie interesujący jest tryb Deep Research, który pozwala na kompleksową analizę setek stron internetowych i tworzenie szczegółowych raportów. Google przedstawiło również projekty wykorzystujące agentów AI: Projekt Astra (asystent głosowy nowej generacji), Projekt Mariner (agent do nawigacji po przeglądarce) oraz Jules (asystent do kodowania).

Czytaj więcej

👀 ChatGPT zyskuje wzrok – nowe możliwości widzenia w czasie rzeczywistym

OpenAI wprowadziło długo oczekiwaną funkcję analizy obrazu w czasie rzeczywistym do ChatGPT. Advanced Voice Mode z funkcją widzenia pozwala użytkownikom kierować kamerę telefonu na obiekty i otrzymywać natychmiastowe odpowiedzi i analizy. System potrafi także analizować zawartość ekranu, pomagając w nawigacji po ustawieniach czy rozwiązywaniu problemów matematycznych. Funkcja jest dostępna dla subskrybentów ChatGPT Plus, Team i Pro, a jej wdrażanie rozpoczęło się w tym tygodniu. Dodatkowo, z okazji świąt, OpenAI dodało tryb „Santa”, pozwalający na rozmowy z AI używającym głosu Świętego Mikołaja.

Czytaj więcej

⚡ Claude 3.5 Haiku – najszybszy model AI od Anthropic

Anthropic udostępnił szerokiemu gronu użytkowników model Claude 3.5 Haiku, który był wcześniej dostępny tylko przez API. Model wyróżnia się wyjątkową szybkością działania i dorównuje, a czasem przewyższa wydajnością większy model Claude 3 Opus, szczególnie w zadaniach związanych z programowaniem i przetwarzaniem danych. Model oferuje kontekst do 200 000 tokenów, co jest imponującym wynikiem w porównaniu do konkurencji. Haiku jest teraz dostępny dla wszystkich użytkowników Claude, z darmowym dostępem w ramach limitów dziennych oraz rozszerzonym dostępem dla subskrybentów Pro.

Czytaj więcej

🎮 Google tworzy system Android XR dla rzeczywistości rozszerzonej

Google przedstawiło Android XR, nowy system operacyjny przeznaczony dla urządzeń AR/VR. Stworzony we współpracy z Samsungiem i Qualcommem, system ma na celu uczynienie interakcji z technologią bardziej naturalną dzięki wykorzystaniu sztucznej inteligencji. Platforma wykorzystuje asystenta Gemini i umożliwia płynne przełączanie się między środowiskiem wirtualnym a rzeczywistym. Pierwsze urządzenie, znane jako Project Moohan, ma zadebiutować w przyszłym roku.

Czytaj więcej

📚 OpenAI i Microsoft finansują dataset Harvardu

Harvard University przygotowuje do udostępnienia ogromną kolekcję blisko miliona książek z domeny publicznej, które będą mogły służyć do trenowania modeli AI. Projekt, finansowany przez OpenAI i Microsoft, ma na celu demokratyzację dostępu do wysokiej jakości danych treningowych. Kolekcja zawiera klasykę literatury oraz teksty specjalistyczne w różnych językach, co ma pomóc mniejszym firmom i indywidualnym badaczom w rozwoju własnych modeli AI.

Czytaj więcej

Co jeszcze w świecie AI?

  • Character.AI wprowadza nowe zabezpieczenia dla nastolatków, w tym oddzielny model AI i kontrolę rodzicielską. Czytaj więcej
  • Amazon Prime Video wprowadza funkcję „AI Topics” wykorzystującą uczenie maszynowe do grupowania i rekomendowania treści. Czytaj więcej
  • Lambda Labs uruchamia API do wnioskowania AI, oferując najniższe ceny na rynku. Czytaj więcej
  • Reddit wprowadza funkcję „Reddit Answers” wykorzystującą AI do podsumowywania dyskusji. Czytaj więcej
  • Nvidia zwiększa zatrudnienie w Chinach o ponad 1000 pracowników, koncentrując się na technologii autonomicznej jazdy. Czytaj więcej
  • Stanford proponuje globalną inicjatywę stworzenia wirtualnej komórki przy pomocy AI. Czytaj więcej

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *