Ireneusz Stadler
@2024 Marketing Internetowy
Kulisy kontrowersyjnego treningu AI
W świecie, gdzie sztuczna inteligencja staje się integralną częścią cyfrowej codzienności, zaawansowane chatboty takie jak ChatGPT, Gemini czy Copilot robią ogromne wrażenie swoją „wszechwiedzą”. Ich imponujące możliwości nie biorą się jednak znikąd. To efekt gigantycznych inwestycji – finansowych, technologicznych i energetycznych – oraz nieustającego głodu danych.
Im więcej danych wysokiej jakości, tym lepszy model. Ale z tym właśnie zaczyna być problem. Dostęp do cennych, uporządkowanych i prawnie bezpiecznych treści, które można wykorzystać w treningu AI, kurczy się z miesiąca na miesiąc. Firmy takie jak OpenAI, Google czy Meta muszą szukać nowych źródeł informacji – nie zawsze drogą etyczną.
Ostatnie rewelacje ujawnione w amerykańskim sądzie rzucają cień na działania Mety, właściciela Facebooka, Instagrama i WhatsAppa. Zgodnie z przedstawionymi materiałami dowodowymi, firma miała sięgnąć po zbiór danych pochodzący z pirackich źródeł – w tym legendarnych repozytoriów LibGen i Z-Library. Z raportu wynika, że inżynierowie pracujący nad modelem AI Mety mieli pobrać ponad 80 terabajtów nieautoryzowanych treści, m.in. książek, których rozpowszechnianie narusza prawa autorskie.
Sprawa nabiera jeszcze większego znaczenia, gdy przyjrzymy się wewnętrznej korespondencji zespołu badawczego Mety. Z przecieków wynika, że niektórzy pracownicy mieli poważne obiekcje etyczne wobec „torrentowania” danych z nielegalnych źródeł z poziomu służbowych laptopów – co, jak zauważają specjaliści, automatycznie czyni z pobierającego również nadawcę tych treści w sieci peer-to-peer.
Meta utrzymuje, że oskarżenia są bezpodstawne i zamierza je obalić w trakcie postępowania wyjaśniającego. Jego data nie została jeszcze ogłoszona.
Wielka bitwa o dane trwa – i to nie tylko między firmami technologicznymi. To również sygnał dla twórców, wydawców i właścicieli treści: sztuczna inteligencja potrzebuje paliwa, a tym paliwem są nasze publikacje, wpisy, książki i prace. To, w jaki sposób są one wykorzystywane, coraz częściej będzie podlegać społecznym i prawnym dyskusjom.
Choć Meta deklaruje transparentność i inwestuje w rozwój AI, dla zwykłych użytkowników Facebooka i Instagrama ważniejsze może być coś innego: zasięg organiczny, czyli „darmowy”, od dawna nie jest tym, czym był kiedyś. Obecnie tylko ok. 2–6% Twoich fanów widzi Twój post bez żadnego budżetu promocyjnego. Oznacza to, że nawet świetny content bez wsparcia reklamowego nie dociera do odbiorców.
Dlatego jeśli chcesz realnie zaistnieć w social mediach, promować swoje usługi, produkty lub wydarzenia, inwestycja w Facebook Ads i Instagram Ads to dziś nie dodatek – to konieczność. Meta wie, jak ograniczyć widoczność… ale też wie, jak ją sprzedać.