OpenAI rozważa reklamy, a Tencent udostępnia model video na laptopy

Tencent zaskakuje open-source’owym modelem do tworzenia wideo, który może działać nawet na zwykłym laptopie. OpenAI rozważa wprowadzenie reklam do swoich produktów, co może zmienić model biznesowy firmy. Tymczasem World Labs prezentuje technologię przekształcania zdjęć w interaktywne środowiska 3D. Te i inne nowości w szczegółach poniżej.

Zanim jednak przejdę do newsów chcę kontynuować temat narzędzi MCP, z których można już korzystać w Claude desktop. Jak wiecie w piątek nagrałem i opublikowałem video pokazujące jak skonfigurować te narzędzia pod Windows. Jutro na „Kręgu AI” o 20-ej chcę pokazać zainteresowanym jakie możliwości daje użycie tych narzędzi. Także jeżeli ktoś ma jeszcze problem z uruchomieniem tych narzędzi to postaram się pomóc. Zapraszam!

A teraz przejdźmy do wieści.

🎥 Tencent udostępnia model do generowania wideo

Tencent, chiński gigant technologiczny, zaprezentował nowy model do generowania wideo o nazwie Hunyuan, który jest dostępny jako open source. Co wyróżnia ten model, to fakt, że jest on stosunkowo niewielki (13 miliardów parametrów) i może działać nawet na zwykłym laptopie. Mimo to, według ocen, generuje on wideo lepszej jakości niż konkurencyjne rozwiązania, takie jak RunwayML’s Gen-3, Luma czy inne chińskie modele.

To przełomowe osiągnięcie może znacząco wpłynąć na dostępność i demokratyzację narzędzi do tworzenia wideo przy pomocy AI. Tak jak w przypadku generowania obrazów, gdzie w ciągu ostatniego roku nastąpił ogromny postęp w jakości i realizmie, możemy spodziewać się podobnego skoku w dziedzinie wideo w nadchodzącym roku.

Udostępnienie tego modelu jako open source może przyspieszyć rozwój technologii generowania wideo przez AI, umożliwiając badaczom i programistom na całym świecie eksperymentowanie i ulepszanie tej technologii. To może prowadzić do nowych, innowacyjnych zastosowań AI w produkcji wideo, filmie, marketingu i wielu innych dziedzinach.

Oficjalna strona Przykłady

💰 OpenAI rozważa wprowadzenie reklam do swoich produktów

OpenAI, firma stojąca za popularnym ChatGPT, rozważa wprowadzenie reklam do swoich produktów jako nowe źródło przychodów. To potencjalnie duża zmiana w modelu biznesowym firmy, która do tej pory opierała się głównie na subskrypcjach i opłatach za dostęp do API.

Firma ściągnęła już kluczowych ekspertów od reklamy z firm takich jak Meta i Google, w tym byłego lidera reklam wyszukiwarkowych Google, Shivakumara Venkataramana. OpenAI generuje obecnie około 4 miliardów dolarów rocznie z subskrypcji i dostępu do API, ale koszty rozwoju i utrzymania modeli AI przekraczają 5 miliardów dolarów rocznie.

Decyzja o wprowadzeniu reklam nie jest jednak jednogłośna wśród kierownictwa OpenAI. Sam Altman, CEO firmy, wcześniej wypowiadał się przeciwko reklamom, nazywając je „ostatecznością”. Sarah Friar, CFO OpenAI, potwierdziła, że firma rozważa model reklamowy, ale jednocześnie zaznaczyła, że decyzja nie została wciąż podjęta.

Wprowadzenie reklam mogłoby znacząco zmienić doświadczenie użytkowników korzystających z produktów OpenAI, w tym z ChatGPT. Jednocześnie mogłoby to pomóc firmie w pokryciu ogromnych kosztów związanych z rozwojem zaawansowanych modeli AI.

Czytaj więcej inne źródło

🌍 World Labs tworzy interaktywne światy 3D ze zdjęć

World Labs, startup założony przez Fei-Fei Li, znaną ekspertkę w dziedzinie AI, zaprezentował przełomową technologię, która pozwala przekształcić pojedyncze zdjęcie w interaktywne, trójwymiarowe środowisko. To znaczący krok naprzód w porównaniu do innych narzędzi AI, które generują statyczne obrazy.

System World Labs generuje pełne środowiska 3D, wykraczające poza to, co widoczne jest na oryginalnym zdjęciu, zachowując przy tym spójność podczas eksploracji przez użytkowników. Użytkownicy mogą swobodnie poruszać się i rozglądać w wygenerowanej przestrzeni, korzystając ze standardowych kontrolek klawiatury i myszy.

Technologia oferuje również efekty kamery w czasie rzeczywistym, takie jak głębia ostrości i zoom, a także interaktywne suwaki do manipulacji oświetleniem i animacją scen. System działa zarówno ze zdjęciami, jak i obrazami generowanymi przez AI, co pozwala na łączenie go z narzędziami do generowania tekstu na obrazy czy nawet ze słynnymi dziełami sztuki.

To osiągnięcie otwiera nowe możliwości w dziedzinach takich jak gry, filmy, wirtualne doświadczenia i kreatywne procesy twórcze. W niedalekiej przyszłości tworzenie zaawansowanych światów 3D może stać się tak dostępne, jak generowanie obrazów jest dzisiaj.

Czytaj więcej

🤖 Grok tworzy zabawne obrazy z profili użytkowników X

Model AI Grok, stworzony przez firmę xAI Elona Muska, otrzymał nową, interesującą funkcję na platformie X (dawniej Twitter). Teraz Grok może odnosić się do nazwy użytkownika i zdjęcia profilowego osoby, z którą prowadzi rozmowę, aby tworzyć zabawne, spersonalizowane obrazy.

Na przykład, użytkownicy mogą poprosić Groka o narysowanie ich jako postaci z filmu Pixara, a model stworzy obraz bazując na ich zdjęciu profilowym. To ciekawe połączenie umiejętności rozpoznawania i opisywania obrazów (co robi Grok) oraz generowania nowych obrazów (co wykonuje model Flux stworzony przez Black Forest Labs).

Ta funkcja pokazuje, jak modele AI stają się coraz bardziej zintegrowane i wszechstronne. Zwykle takie łączenie różnych modeli może prowadzić do nierównych wyników, ale w tym przypadku efekt końcowy jest płynny i spójny.

Zobacz

🏦 AI pomaga Commonwealth Bank of Australia w walce z oszustwami

Commonwealth Bank of Australia (CBA), jeden z największych banków w tym kraju, ogłosił, że dzięki zastosowaniu sztucznej inteligencji udało się zmniejszyć straty spowodowane oszustwami o 30%. To imponujący wynik, który pokazuje, jak AI może być skutecznym narzędziem w walce z przestępczością finansową.

Bank wykorzystuje AI do analizy ogromnych ilości danych transakcyjnych w czasie rzeczywistym, co pozwala na szybkie wykrywanie podejrzanych działań. System AI jest w stanie identyfikować nietypowe wzorce zachowań, które mogą wskazywać na próby oszustwa, zanim dojdzie do faktycznej straty finansowej.

Oprócz redukcji strat związanych z oszustwami, CBA wykorzystuje również AI do przyspieszenia procesu udzielania kredytów hipotecznych. Dzięki automatyzacji niektórych etapów oceny wniosków, bank jest w stanie znacznie skrócić czas potrzebny na podjęcie decyzji kredytowej.

Te sukcesy CBA pokazują, jak sztuczna inteligencja może być skutecznie wykorzystywana w sektorze finansowym, nie tylko do zwiększania efektywności operacyjnej, ale także do poprawy bezpieczeństwa klientów i jakości świadczonych usług.

Czytaj więcej

🗣️ Nowe narzędzie do personalizacji głosu od Hume AI

Hume AI wprowadza narzędzie Voice Control, które umożliwia tworzenie niestandardowych głosów AI poprzez intuicyjne suwaki, dostosowując takie cechy jak ton, pewność siebie i entuzjazm. To narzędzie może zrewolucjonizować sposób, w jaki tworzymy głosy AI dla różnych zastosowań, od postaci w grach po lektorów audiobooków.

Czytaj więcej

Ciekawe narzędzie AI… do wyszukiwania kontaktów

Hapestance.ai to narzędzie do… wyszukiwania odpowiedniej osoby wśród Twoich kontaktów. Podłączasz je do swojej skrzynki GMail, konta na X i Linkedin a następnie po prostu piszesz prompt opisujący o kogo ci chodzi, a AI wyszukuje odpowiednie osoby, które już znasz lub które znają Twoi znajomi (czyli mogą cię przedstawić).

Ktoś odważny chce przetestować? Wejdź tutaj a potem daj znać o wynikach.

Co jeszcze w świecie AI?

Gemini Advanced otrzymało dwa nowe rozszerzenia: Google Keep i Tasks dla użytkowników Workspace, a także WhatsApp dla użytkowników Androida. Czytaj więcej
OpenAI stara się o znak towarowy dla „Open o1”, co może być związane z planami rozwoju ich najnowszych modeli AI. Czytaj więcej
Elon Musk złożył wniosek o nakaz sądowy mający na celu zablokowanie przejścia OpenAI na status komercyjny, co jest kolejnym krokiem w jego sporze z firmą. Czytaj więcej
Kanadyjskie firmy mediowe dołączyły do listy podmiotów pozywających OpenAI za naruszenie praw autorskich, twierdząc, że ich treści były wykorzystywane bez zgody do trenowania modeli AI. Czytaj więcej
Tenstorrent, startup zajmujący się chipami AI, pozyskał 700 milionów dolarów w rundzie finansowania prowadzonej przez Samsunga i wspieranej przez Jeffa Bezosa, osiągając wycenę 2,6 miliarda dolarów. Czytaj więcej
Amazon Web Services ogłosił znaczące modernizacje centrów danych w celu wsparcia chipów AI nowej generacji i obciążeń związanych z generatywną AI, w tym nowe systemy chłodzenia cieczą i poprawę efektywności energetycznej. Czytaj więcej

To już wszystko w dzisiejszym wydaniu. Jak widać, świat AI rozwija się w zawrotnym tempie, przynosząc nowe możliwości w dziedzinie generowania wideo, personalizacji interakcji z użytkownikami, czy tworzenia interaktywnych środowisk 3D. Jednocześnie obserwujemy, jak giganci technologiczni poszukują nowych modeli biznesowych, aby finansować kosztowny rozwój AI. Zachęcam do śledzenia tych fascynujących zmian i eksperymentowania z nowymi narzędziami AI.

AI Sprinters