[AI] Sora wyciekła, Anthropic łączy AI ze światem, a Nvidia tworzy dźwięki

Witaj Reader!

Świat AI znów nabiera rozpędu. Mam dla Was kilka przełomowych doniesień, od wycieków niezwykłego modelu wideo OpenAI, przez nowe sposoby łączenia AI z danymi, aż po generowanie nieistniejących dźwięków – to wszystko dzieje się teraz. Przyjrzyjmy się bliżej tym fascynującym wydarzeniom i zastanówmy się, na co się to może przełożyć u nas – w pracy i w życiu.

🔌 Anthropic wprowadza Model Context Protocol (MCP)

Anthropic zaprezentował Model Context Protocol (MCP), otwarty standard umożliwiający łączenie systemów AI z różnorodnymi źródłami danych. MCP ma na celu uproszczenie integracji AI z lokalnymi i zdalnymi zasobami danych, narzędziami biznesowymi i środowiskami programistycznymi.

Protokół działa jako „uniwersalny tłumacz”, pozwalając systemom AI na płynną komunikację z różnymi systemami danych. Anthropic udostępnił już gotowe serwery MCP dla popularnych narzędzi takich jak Google Drive, Slack i GitHub, zachęcając jednocześnie deweloperów do tworzenia własnych konektorów.

MCP może znacząco uprościć proces integracji AI z istniejącymi systemami, co przyspieszy adopcję AI w przedsiębiorstwach i umożliwi tworzenie bardziej zaawansowanych, kontekstowych asystentów AI. To krok w kierunku bardziej połączonego i inteligentnego ekosystemu narzędzi cyfrowych.

Czytaj więcej

Jak dla mnie to jest najważniejszy news od dawna!

W praktyce działa to w tej chwili w taki sposób, że poprzez klienta desktopowego Claude (dostępny na Windows i Mac) możesz dać Claude możliwość korzystania z czego tylko chcesz – i co umiesz zaprogramować. Tutaj Anthropic udostępnił gotowe „serwery”, których instalacja nie wymaga umiejętności programowania. Z ich pomocą można dać Claude dostęp m.in. do wyszukiwarki internetowej Brave, do wybranych katalogów w lokalnym systemie plików, do GitHub i tak dalej. Tutaj znajduje się krótka instrukcja instalacji.

Niestety, działa to dobrze i zgodnie z opisem tylko na platformie Mac, na platformie Windows trzeba się trochę napracować, żeby wszystko działało tak jak trzeba.Spędziłem większą część wczorajszego dnia starając się to uruchomić na Windows i dopiero dziś wpadłem na to jak to się da zrobić.

Jeżeli będzie zainteresowanie z Waszej strony to mogę nagrać film z instrukcją. Daj znać czy chcesz taki video ode mnie!

🎥 Wyciek dostępu do modelu Sora od OpenAI

Tajemnicza grupa ujawniła dostęp do modelu Sora, zaawansowanego narzędzia OpenAI do generowania wideo z tekstu. Projekt został opublikowany na platformie Hugging Face, umożliwiając użytkownikom generowanie krótkich klipów wideo na podstawie tekstowych opisów. Choć projekt szybko został wyłączony, niektórzy użytkownicy zdołali go wykorzystać i potwierdzili, że wygenerowane materiały nosiły charakterystyczne cechy pracy OpenAI.

Grupa stojąca za wyciekiem twierdzi, że OpenAI wywierało na nich presję, by promowali pozytywny przekaz o Sora bez oferowania wynagrodzenia za ich wysiłki. Uważają oni, że program wczesnego dostępu był bardziej skupiony na PR i marketingu niż na wspieraniu kreatywnej i krytycznej ekspresji. Whistleblowerzy zarzucają również OpenAI wprowadzanie opinii publicznej w błąd co do rzeczywistych możliwości Sora.

To wydarzenie rzuca światło na napięcia między firmami technologicznymi a społecznościami entuzjastów AI i twórców, podkreślając potrzebę większej przejrzystości i uczciwości w procesach rozwoju AI.

Czytaj więcej

🎵 Nvidia prezentuje Fugatto – model AI do generowania dźwięków

Nvidia zaprezentowała Fugatto, zaawansowany model AI do generowania i edycji dźwięku. Model potrafi tworzyć muzykę i efekty dźwiękowe na podstawie opisów tekstowych oraz modyfikować istniejące nagrania w nowatorski sposób. Fugatto może na przykład sprawić, że trąbka zabrzmi jak szczekający pies lub zmienić akcent i emocjonalny ton wypowiadanych słów.

Model został wytrenowany na milionach próbek dźwiękowych z otwartych źródeł i ma potencjał do rewolucjonizacji pracy w branżach muzycznej, filmowej i gier wideo. Fugatto może łączyć różne dźwięki, tworząc unikalne soundscapes, co otwiera nowe możliwości dla twórców.

Nvidia nie udostępniła jeszcze Fugatto publicznie, oceniając potencjalne ryzyka związane z naruszeniem praw autorskich i dezinformacją. Pokazuje to ostrożne podejście firmy do wprowadzania przełomowych technologii AI na rynek.

Czytaj więcej

🖼️ Runway prezentuje Frames – nowy model do generowania obrazów

Runway wprowadził nowy model fundamentalny o nazwie Frames, który ma na celu redefinicję generowania obrazów poprzez precyzyjną kontrolę stylistyczną i zwiększoną wierność wizualną. Model rozwiązuje uporczywy problem utrzymania spójności w różnych rezultatach kreatywnych, umożliwiając użytkownikom projektowanie immersyjnych, spójnych światów wizualnych z niezwykłą dokładnością.

Frames jest dostępny poprzez platformę Gen-3 Alpha i API Runway. Model demonstruje swoje możliwości w różnych zastosowaniach, od tworzenia okładek retro albumów po wysoce stylizowane kompozycje. Połączenie realizmu i detali estetycznych zapewnia profesjonalistom kreatywnym zaawansowany zestaw narzędzi do tworzenia wizualnie spójnych i angażujących obrazów.

To kolejny krok w kierunku coraz bardziej zaawansowanych narzędzi AI do tworzenia treści wizualnych, które mogą znaleźć szerokie zastosowanie w branżach kreatywnych.

Czytaj więcej

🧠 /dev/agents – nowy startup AI od byłych liderów Google, Meta i Stripe

Grupa byłych dyrektorów z Google, Meta i Stripe wyszła z ukrycia, aby uruchomić nowy startup o nazwie /dev/agents. Firma zebrała 56 milionów dolarów w finansowaniu zalążkowym, z celem stworzenia tego, co nazywają „momentem Androida” dla agentów AI.

Startup planuje zbudować oparty na chmurze system operacyjny, który pozwoli agentom AI działać płynnie na telefonach, laptopach, samochodach i innych urządzeniach. Zespół założycielski obejmuje byłego VP inżynierii Androida Davida Singletona, VP Oculusa Hugo Barrę i głównego projektanta Chrome OS Nicholasa Jitkoffa.

Firma ma na celu rozwiązanie głównych barier w rozwoju agentów AI, w tym nowych wzorców interfejsu użytkownika, modeli prywatności i uproszczonych narzędzi dla deweloperów. To ambitne przedsięwzięcie może położyć podwaliny pod to, jak wszyscy będziemy wchodzić w interakcje z AI w przyszłości.

Czytaj więcej Inne źródło

🔄 Zoom zmienia markę na platformę „AI-first”

Zoom ogłosił zmianę marki z „Zoom Video Communications” na „Zoom Communications”, dążąc do odejścia od korzeni wideokonferencyjnych firmy i pozycjonując się jako platforma workplace oparta na AI. Nowa wersja Zoom 2.0 nosi podtytuł „platforma pracy oparta na AI dla ludzkiego połączenia”, kładąc nacisk na narzędzia AI-first, które mają pomóc pracować „szczęśliwiej, mądrzej i szybciej”.

Zoom twierdzi, że AI Companion będzie „sercem” tej inicjatywy, z rozszerzoną kontekstualizacją, dostępem do sieci i możliwością podejmowania działań agencyjnych w całej platformie. Zmiana marki następuje po niedawnych premierach, w tym AI Companion 2.0, Zoom Docs i innych narzędzi AI dla miejsca pracy mających na celu konkurowanie z innymi gigantami technologicznymi.

Ta strategiczna zmiana pokazuje, jak firmy technologiczne coraz bardziej stawiają na AI jako kluczowy element swojej oferty, dążąc do redefinicji sposobu, w jaki pracujemy i komunikujemy się.

Czytaj więcej

Żałośnie niska jakość podsumowań transkrybcji spotkań jakie aktualnie generuje AI Zoom-a trochę mi każe podchodzić sceptycznie, ale to pokazuje szerszy trend.

Co jeszcze w świecie AI?

Naukowcy z MIT stworzyli narzędzie AI generujące realistyczne zdjęcia satelitarne przyszłych powodzi, pomagając społecznościom wizualizować i przygotować się na nadchodzące kataklizmy. Czytaj więcej
Perplexity rozważa wejście na rynek sprzętu poprzez kompaktowe urządzenie poniżej 50 dolarów, mające ułatwić głosowe interakcje typu pytanie-odpowiedź. Czytaj więcej
Claude AI od Anthropic otrzymał nową funkcję pozwalającą użytkownikom dostosować styl pisania chatbota, oferując predefiniowane style lub możliwość trenowania AI na podstawie własnych próbek tekstu. Czytaj więcej Mi się to nie podoba, ale cóż…
Uber tworzy nowy dział Scaled Solutions, który zatrudni pracowników kontraktowych specjalnie do etykietowania danych dla modeli AI, obsługując zarówno potrzeby wewnętrzne, jak i klientów zewnętrznych. Czytaj więcej
Thomson Reuters integruje model o1-mini od OpenAI ze swoim asystentem prawnym AI CoCounsel, zwiększając precyzję w analizie dokumentów prawnych i zarządzaniu zadaniami. Czytaj więcej
Francuski startup Mistral AI rozszerza swoją obecność w Dolinie Krzemowej, otwierając nowe biuro w Palo Alto i zwiększając liczbę naukowców i inżynierów AI w USA. Czytaj więcej inne źródło Tylko czekać aż w ogóle porzucą skansen technologiczny jakim jest EU.

🤦Rodzynek z rodzimego podwórka

Na koniec coś, co powoduje, że można się tylko załamać. Otóż jak donosi Dziennik Gazeta Prawna trwają prace w rządzie nad utworzeniem katalogu zawodów… które może wykonywać tylko człowiek! Czyli w czasach kiedy wszyscy prześcigają się w inwestycjach w AI i inne nowe technologie „nasz” rząd pracuje nad tym… jak zazać ich stosowania, czyli dosłownie, naprawdę robić z Polski skansen. Głupota jaka jest fundamentem tego podejścia nie zaskakuje, ale i tak zasmuca.

To już wszystko w dzisiejszym wydaniu newslettera. Zachęcam do śledzenia tych trendów i eksperymentowania z nowymi narzędziami AI. No i oczywiście do błyskawicznego podniesienia swoich możliwości w tym zakresie na naszym szkoleniu AI Toolbox Intro – ostatnia edycja tegoroczna już w przyszłym tygodniu.

Jeśli uważasz, że te informacje są wartościowe, podziel się tym newsletterem ze znajomymi i współpracownikami. Do zobaczenia w kolejnym wydaniu!

Pozdrawiam,
Andy

AI Sprinters