ChatGPT е всичко, за което светът на технологиите може да говори напоследък и с добра причина. Инструментът, задвижван от AI, е впечатляващ, но има и много притеснения – нарушаване на авторски права, плагиатство, използване в класните стаи, дори загубени работни места, така че не е чудно, че хората, които пишат, за да си изкарват прехраната, се тревожат за AI, който привидно може да пише добре. Но има и технологични компании с бързи очи, които виждат бъдещето – способността на компютрите да общуват естествено и да създават съдържание, което бизнесът действително може да използва, в мащаб, скорост и цена, които хората не могат да достигнат.
Но ChatGPT, Google Bard и чатът Bing на Microsoft са само една малка част от генеративната AI революция. Светът на изкуството бръмчи за нови генеративни инструменти за изкуство с изкуствен интелект през последната година и се побърква по едни и същи проблеми – пристрастия, авторски права, загубени работни места и т.н. Deepfakes, при които невронните мрежи разменят хора във видеоклипове със зашеметяващ реализъм, бяха върха на айсберга.
Тези инструменти не са просто проблясък в тигана. Те са в ранна детска възраст и се подобряват много бързо. Големи технологични компании като Google и Microsoft виждат този нов генеративен AI като масивна част от цялото ни бъдеще. Залагането на претенции и изграждането на лидерска позиция е толкова важно за тях, колкото доминирането в мрежата беше през 90-те години.
Но има един играч, който не е в играта: Apple. Най-ценната технологична компания на земята изглежда напълно пропуска пълна революция в компютрите. Apple не е непознат за AI – той предизвика революция в асистента със Siri – но също така вече пропиля лидерството си, като не инвестира достатъчно много, за да отблъсне конкурентите.
Повтаря ли се историята с генеративния AI? Или Apple има нещо невероятно в ръкава си и просто е невероятно потаен, както винаги?
AI, който анализира, е стар, създаването на AI е ново
Всички най-големи технологични компании крещят за AI от години. AI, който изолира и анализира вашата реч за диктовка и гласови асистенти и може да разграничава гласовете за персонализирани резултати. AI, който сглобява записани звуци, за да „говори“ с вас. AI, който изолира части от изображения, за да ги редактира лесно. AI, който идентифицира обекти и хора, за да подпомогне вашите търсения. AI, който ви позволява да избирате текста във всяко изображение.
Apple прави всички тези неща. За компанията е толкова важно, че те вграждат Neural Engine във всички свои чипове, специализиран хардуер, който ускорява задачи за машинно обучение като тези. Apple дори работи върху най-голямото AI предизвикателство от всички, самоуправляващите се коли.
Но генеративен AI е нещо друго. Това е по-нов клас AI, който създава нещо изцяло ново, като почти не използва въвеждане на текст. Да, обучението на моделите отнема много време и планина от данни, но тогава тези модели, които потребителите ще изпълняват, са сравнително малки и привидно могат да направят безкрайно количество нови неща. AI, който може да намери всички картофи във вашата фотобиблиотека, е нещо напълно различно от това, което може да нарисува картофи от нулата в голямо разнообразие от артистични стилове.

Марк Хахман / IDG
ChatGPT, Bard и Bing
Основната генеративна AI технология в момента е ChatGPT от OpenAI. Усъвършенстваният чатбот и инструментите, изградени върху него, вече се използват в света на бизнеса за генериране на статии, имейли, шаблони и други, с известни противоречия. Студентите го използват, за да пишат цели доклади от малка подкана и резултатите са достатъчно добри, за да има надпревара за разработване на добри инструменти за учителите за идентифициране на ChatGPT писмени задачи.
Тъй като е обучен с много уеб данни, които, макар и остарели, все още са подходящи за много неща, той може да бъде почти като търсачка, с която разговаряте. Това откачи Google толкова много, че обяви своя собствен съперничещ разговорен AI продукт, Bard, който все още не е напълно готов за изпробване от света, но ще се появи скоро. Публична демонстрация предостави грешна информация за космическия телескоп James Webb, така че Google очевидно има какво да върши.
Microsoft също обяви нова функция за разговорно търсене, която можете да започнете да използвате точно сега в Bing и браузъра Edge. Създаден е на ChatGPT с някои подобрения и модификации.
Това са нещо повече от играчки или любопитни неща. Това са реални инструменти, които хората използват, за да вършат реална работа и да захранват творчески проекти. Всичко е в началото и понякога изглежда, че не е готово за света като цяло, но скоростта на подобрение и иновации е зашеметяваща – AI моделите се удвояват по сложност и изтънченост на всеки шест месеца.
Стабилна дифузия, Midjourney, DALL-E
И това не е само писменото слово. Всички добре се посмяхме, правейки глупави подкани с DALL-E 2 миналата година, но с по-нататъшно обучение и подобрения, тези генеративни AI инструменти за изкуство станаха добри за много повече от просто създаване на изображения на котки в стил аниме, гмуркащи се с акваланг с рибарници главите им.
Midjourney и Stable Diffusion станаха толкова добри, че създават изкуство, което лесно може да украси корицата на списание – и може да доведе до десетки за няколко минути.
Тези инструменти могат да направят много повече от просто създаване на напълно нови изображения в широка гама от стилове. Те могат да променят входните изображения. App Store вече е пълен с приложения за създаване на аватари и профили, които използват този софтуер, за да направят няколко снимки на лицето ви и да ги модифицират по зашеметяващ начин, като променят физическите черти, без някой да е по-мъдър. Като например слагането на слънчеви очила, които изглеждат напълно истински.
Миналата година това беше трик, но технологията се развива толкова бързо, че вече е инструмент. Adobe вече подобри много от своите приложения с инструменти за генериране на изображения, базирани на AI, за възстановяване на снимки с едно щракване и значително подобрено изтриване на обекти. Но компанията планира скоро да добави значителен генеративен AI към своя набор от инструменти, което ви позволява буквално да вмъквате изображения в съществуващи снимки и произведения на изкуството, които изглеждат така, сякаш пасват точно.

Dall-E 2 е повече от просто забавно губене на време за създаване на шантави изображения.
Dalle2.app
Тесен прозорец за действие
И къде е Apple във всичко това? Компанията се позиционира като технологичен лидер, особено в творческото пространство. Но с изключение на няколко публикации в блогове от изследователски сайт за ML и някои оптимизации с относително малко усилия към библиотеки за силикон на Apple, Apple Изглежда да седя този. Искам да кажа, мисля, че DiffusionBee на Divam Gupta е супер готино, но е малко независимо приложение на трета страна, което не е актуализирано от доста време и вече е зад най-съвременното поколение на AI изображения.
Тази технология ще бъде напълно трансформираща. не ми вярваш Вижте изследванията на OpenAI за генериране на музика. Създава нова музика в различни стилове, включително пеене, напълно от нищото. VALL-E на Microsoft може да генерира шокиращо реалистични гласове, които звучат много близо до истински човек, като използва само малък фрагмент от гласа на този човек като вход. Може дори да имитира различни емоционални състояния.
Много от тези проекти и десетки други все още са в етап на проучване. Не е трудно да се намерят недостатъци на някой от тях. Но пътуването от изследването до реалния свят ще бъде бързо и недостатъците ще бъдат изчезващо трудни за намиране.
Apple разполага с инструментите за изграждане на свой собствен генериращ AI чатбот с Neural Engine, вграден в неговите чипове за iPhone и Mac, който е способен на до 15.8 трилиона операции в секунда, заедно с Core ML и API за машинно обучение. Но не сме забелязали никакво движение от Купертино. Точността и скоростта са от първостепенно значение за чат ботовете с изкуствен интелект – акциите и доверието в Google паднаха тази седмица след грешка в неговия чатбот Bard – така че е възможно той да работи зад кулисите със Siri. Но с изобилие от инструменти на негово разположение, въпросът остава: Apple изобщо обръща ли внимание?
Ако не наблюдава внимателно AI пространството, Apple може да не осъзнае колко бързо се развива. Отне една година на генеративния AI да премине от „глупава играчка за онлайн изследователски проект“ до „дуелиращи съобщения от Microsoft и Google“. След още две години тези инструменти ще бъдат десет пъти по-добри и ще има много повече от тях. Ще ви бъде трудно да кажете кое е истинско или изцяло генерирано от AI от нищото. Ако имате големи идеи, но ограничени артистични умения, генеративният AI ще улесни много реализирането на мечтите ви.

Чиповете M1 и M2 Mac на Apple имат специален Neural Engine, способен на
човекy трилиони операции всяка секунда.
Ябълка
Със Siri, Apple беше в челните редици на предоставянето на AI гласов асистент на масите. С развитието на тази технология Apple изостана много и сега Siri често се разглежда като разочарование, което не може да се сравни с Google Assistant или Alexa. Когато става въпрос за генеративен AI, Apple дори няма предимство на първия, както беше със Siri. Големи и малки технологични компании вече доставят мощни инструменти. Без действие Apple просто ще се окаже, че ще направи част от хардуера, върху който ще работи нашето генеративно, управлявано от AI бъдеще.
Без да осъзнава силата на тази нова технология в собствения си софтуер и услуги, Apple ще позволи на всички останали да определят състоянието на техниката за това, което може да бъде най-важната промяна в компютърните технологии от десетилетия. Може би компанията е съгласна с това, но тъй като продажбите на хардуер намаляват, а софтуерът и услугите на бизнеса на Apple растат, тя наистина не може да си позволи да не бъде лидер в генеративната AI революция.
Разбира се, Apple е една от най-потайните компании в технологиите, особено що се отнася до софтуера. Apple може да има големи екипи, които работят усилено, за да внесат генеративни AI функции в iMovie, Final Cut Pro, Logic Pro, Photos, Mail, Messages и целия пакет iWork. Всички те могат да бъдат напълно трансформирани от мощни генеративни AI инструменти. Знаем, че Apple купи поне една генеративна AI компания, AI Music, преди около година. Не би било неразумно тази година да видите поне инструмент за „генериране на оригинален незабавен саундтрак за вашето видео“ в продуктите на Apple.
Може да не чуем нищо за генеративния AI от Apple, а след това в WWDC, BAM! Генеративен AI от световна класа в продуктите на Apple!
Надявам се, че случаят е такъв, защото ако Apple закъснее с подобна трансформационна технология, това ще обрече своя софтуер да изостава с години от своите конкуренти за години напред.
Източник: www.macworld.com