Końcówka roku przynosi nam wiele nowych produktów w świecie AI. Otwiera je nowy ChatGPT Pro – element „festiwalu nowości” w ramach którego przez 12 dni obiecują każego dnia jakąś nowość.
Warto też docenić Google – firma pokazała technologię generowania trójwymiarowych światów z pojedynczych obrazów oraz wzięła się za analizę emocji w modelu PaliGemma 2.
🤖 OpenAI wprowadza ChatGPT Pro z o1 za… 200 dolarów miesięcznie
OpenAI zaprezentowało nową wersję swojej subskrypcji – ChatGPT Pro w cenie 200 dolarów miesięcznie. Nowa oferta zapewnia nieograniczony dostęp do najnowszych modeli firmy, w tym pełnej wersji modelu rozumowania o1, GPT-4o oraz zaawansowanych funkcji głosowych. Model o1 charakteryzuje się 34% mniejszą liczbą błędów w złożonych zadaniach dzięki temu, że waliduje swoje obliczenia. Użytkownicy Pro otrzymają też dostęp do „trybu pro” modelu o1, który wykorzystuje większą moc obliczeniową do rozwiązywania szczególnie trudnych problemów.
Relatywnie wysoką cenę OpenAI uzasadnia kosztami utrzymania i rozwoju zaawansowanych modeli AI.
Z jednej strony $200 to dużo – z drugiej to nadal taniej niż pracownik, nawet w Polsce. Już widziałem przykłady zastosowań głównie programowaniu, które są naprawdę niezłe.
Z drugiej strony wczoraj szukaliśmy zwięzłej nazwy dla pewnego warsztatu. OpenAI o1 zaproponował jedną: „Coachingowe narzędzia komunikacyjne: słuchanie, pytania, parafraza, przeramowanie”. Dla tego samego zapytania Claude 3.5 Sonnet zaproponował aż cztery propozycje, w tym „Narzędzia świadomego dialogu”, która jest po prostu świetna!
Każdy kto ma płatną subskrybcję GPT może wypróbować o1 w wersji podstawowej, ale uwaga – liczba zapytań do tego modelu jest ograniczona do 50 w danym tygodniu!
🎮 Google DeepMind prezentuje Genie 2 – generowanie gier z obrazów
Google DeepMind zaprezentował Genie 2, rewolucyjny model AI, który potrafi przekształcać pojedyncze obrazy w interaktywne, trójwymiarowe środowiska z fizyką, oświetleniem i kontrolą postaci. System utrzymuje spójność przestrzenną, pamiętając obszary, które gracz już odwiedził, nawet gdy są poza ekranem. Model obsługuje zarówno perspektywę pierwszoosobową jak i izometryczną, generując światy w rozdzielczości 720p. Co ciekawe, sztuczny agent SIMA AI potrafił już nawigować po tych wygenerowanych środowiskach, wykonując polecenia w języku naturalnym.
Jak już pisałem: przyszłość developerów gier nie maluje się w zbyt jasnych barwach…
👀 Microsoft wprowadza Copilot Vision – AI, która widzi Twój ekran
Microsoft udostępnił w wersji testowej Copilot Vision – nową funkcję swojego asystenta AI, która pozwala mu „widzieć” zawartość ekranu w przeglądarce Edge. Asystent może analizować tekst, obrazy i rozumieć zawartość stron internetowych w czasie rzeczywistym, pomagając użytkownikom w zadaniach takich jak zakupy online czy planowanie podróży. Funkcja jest dostępna początkowo dla wybranych subskrybentów Copilot Pro, a Microsoft szczególnie dba o prywatność – dane z sesji są usuwane po jej zakończeniu.
🌍 Meta inwestuje 10 miliardów dolarów w centrum AI w Luizjanie
Meta ogłosiła plan budowy centrum danych AI w północno-wschodniej Luizjanie za 10 miliardów dolarów. Projekt ma stworzyć ponad 500 bezpośrednich miejsc pracy i tysiąc pośrednich. Centrum zajmie powierzchnię 4 milionów stóp kwadratowych na terenie farmy Franklin. Meta zobowiązała się do zasilania centrum w 100% energią odnawialną i zainwestowania ponad 200 milionów dolarów w lokalną infrastrukturę. Budowa ma trwać do 2030 roku.
🧠 Firma xAI Elona Muska pozyskuje 6 miliardów dolarów finansowania
xAI, firma zajmująca się sztuczną inteligencją założona przez Elona Muska, zdobyła dodatkowe 6 miliardów dolarów finansowania, zwiększając łączną wartość funduszy do 12 miliardów. Środki te mają zostać przeznaczone na rozwój i zatrudnianie nowych talentów. Głównym produktem firmy jest asystent AI o nazwie Grok, zintegrowany z platformą X. Plan zakłada wykorzystanie danych z Tesli i SpaceX do trenowania Groka, a celem jest przewyższenie możliwości OpenAI.
Co jeszcze w świecie AI?
- OpenAI nawiązało współpracę z wydawcą Future, dając użytkownikom ChatGPT dostęp do treści z ponad 200 marek tej grupy. Czytaj więcej
- OpenAI przekształca się w pełni w firmę komercyjną – obecnie zamierzają usunąć zapisy z umowy z Microsoft, które ograniczały dostęp giganta z Redmond do modeli „AGI”. Czytaj więcej
- Google wprowadza ekspresyjne napisy na Androidzie, które lepiej oddają emocje i kontekst wypowiedzi dzięki AI. Czytaj więcej
- AWS zaprezentował nowe narzędzia do łatwiejszej integracji danych strukturalnych i niestrukturalnych w przetwarzaniu RAG. Czytaj więcej
- TSMC prowadzi rozmowy z Nvidia w sprawie produkcji chipów AI Blackwell w nowej fabryce w Arizonie. Czytaj więcej
- Sundar Pichai zapowiada znaczącą transformację Google Search w 2025 roku dzięki integracji AI. Czytaj więcej
To już wszystkie najważniejsze wiadomości z tego tygodnia w świecie AI. Jak widać, końcówka roku przynosi nam wiele ekscytujących nowości – najpierw narzędzia MCP w Claude, teraz nowe modele w OpenAI. A przecież do końca roku jeszcze parę tygodni!
A przy okazji polecamy nasze narzędzia MCP:
- andybrandt/mcp-simple-openai-assistant: MCP server that gives Claude ability to use OpenAI’s GPTs assistants
- andybrandt/mcp-simple-arxiv: Tool to work with arXiv, provide LLM with ability to search and read papers from there
- andybrandt/mcp-simple-timeserver: Simple solution to give Claude ability to check current time via MCP
Dodaj komentarz