Кинеската компанија за вештачка интелигенција DeepSeek го потресе светот со најновата иновација – еве зошто

Кинеската компанија за вештачка интелигенција (AI) DeepSeek предизвика вистинска бура во технолошката заедница со објавувањето на ултраефикасни AI модели, кои можат да се носат со водечките американски компании како OpenAI и Anthropic.

Основана во 2023 година, DeepSeek ги постигна овие резултати со многу помалку финансиски средства и компјутерска моќ од своите конкуренти.

Минатата недела, компанијата го претстави својот нов модел “reasoning” R1, кој привлече огромно внимание кај истражувачите, инвеститорите и водечките играчи во AI индустријата. А само неколку дена подоцна, на 28 јануари, DeepSeek објави уште еден модел што обработува не само текст, туку и слики.

Но, што точно направи DeepSeek, и како успеа да го постигне тоа?

 

Што направи DeepSeek?

Во декември, DeepSeek го објави својот V3 модел, кој е исклучително моќен „стандарден“ јазичен модел, способен да се натпреварува со GPT-4o од OpenAI и Claude 3.5 од Anthropic.

Овие AI модели понекогаш прават грешки и измислуваат информации, но можат да извршуваат задачи како одговарање на прашања, пишување есеи и генерирање компјутерски код. На одредени тестови за логичко размислување и математика, тие постигнуваат дури и подобри резултати од просечен човек.

Но, најголемото изненадување беше цената на развојот на V3 – само 5,58 милиони долари. За споредба, развојот на GPT-4 чинеше над 100 милиони долари.

Дополнително, DeepSeek го тренираше V3 користејќи околу 2.000 специјализирани графички процесори (GPUs) од типот H800 произведени од NVIDIA, додека другите компании користат до 16.000 многу помоќни H100 чипови.

На 20 јануари, DeepSeek го претстави моделот R1, кој се фокусира на „размислување“ и решавање на сложени проблеми чекор по чекор. Овој модел е особено ефикасен во задачи што бараат разбирање на контекст и стратешко планирање.

Дополнително, DeepSeek ги примени истите техники за создавање на „разумни“ верзии на помали, отворени AI модели што можат да работат на обични компјутери.

Ова предизвика огромен интерес за DeepSeek, ја зголеми популарноста на нивната V3-чатбот апликација и доведе до пад на вредноста на технолошките акции. Во моментов, NVIDIA загуби околу 600 милијарди долари на берзата.

Како успеа DeepSeek?

Клучот за успехот на DeepSeek е ефикасноста – постигнување на високи резултати со помалку ресурси. Нивните научници развија две револуционерни техники кои можат да бидат прифатени од целата AI индустрија.

1. Техника базирана на “спарситет” (sparsity)

AI моделите користат огромен број параметри за обработка на информации. На пример, V3 има околу 671 милијарда параметри, но само мал дел од нив се активира при секој влез.

Вообичаено, предвидувањето на точните параметри е тешко, но DeepSeek разви нов метод што овозможува тренирање само на најрелевантните параметри, значително намалувајќи го времето и трошоците за развој.

2. Паметно складирање на податоци

DeepSeek пронајде иновативен начин за компресирање на податоците, со што тие можат да се складираат и обработуваат побрзо.

 

 

Што значи ова за иднината на AI?

DeepSeek ги објави своите модели под MIT лиценца, што значи дека било кој може да ги преземе, користи и модифицира бесплатно.

За некои AI компании, ова може да биде голем проблем, бидејќи нивната профитабилност ќе биде загрозена од бесплатни, моќни алтернативи. Но, за истражувачите и корисниците, ова е огромен чекор напред.

👉 За истражувачите, AI развојот досега беше резервиран за компании со огромни ресурси. Сега, со помалку компјутерска моќ, повеќе научници и универзитети ќе можат да експериментираат со AI.

👉 За корисниците, AI услугите може да станат поевтини. Наместо да се потпираат на скапи cloud-сервиси со месечни претплати, многу AI модели ќе можат да работат директно на лаптопи и телефони.

👉 За најголемите компании, сепак, останува нејасно дали методите на DeepSeek ќе доведат до помоќни AI модели во целина, или само до поефикасни.

DeepSeek ја промени играта во AI индустријата. Со нови, ефикасни техники и бесплатни AI модели, тие го направија вештачката интелигенција подостапна од кога било. Дали ова ќе биде пресвртна точка во AI истражувањето – останува да видиме. 🚀

 

  • Rade напиша:

    Ne sum ekspert za informatika ai i slicni raboti ama doata citam po internet i gi imam probano ovie ai modeli asistenti, aplikacii ili kako i da se vikaat. Osven sto crpat informacii od internet i ti gi serviraat na tacna za drugo ne se bas sposobni. Nivnata rabota e nekako copy paste, daleku od ai.
    Posebno pa noviot samsung, od ai ima samo marketing. Dajte mu na gemini avtorizacija za koristenje na aplikaciite sto gi imate na telefonot, maps, poraki i doatapnost do internet i ke vi najde italijanski pet friendly restorant vo sekoe vreme. Ama normalno ke treba da platite na google okolu 20$ mesecno.
    I pak tuka nema nisto ai, otvorete google maps, najdete si restorant i spodelete go po poraka so kogo sakate, ke imate samo eden cekor povekje nego istoto da go napravite so ai na samsung.
    Nemaat vrska ai stvarive ama mora da se laze nekako narod za da mu se cicaat parite.

  • Коментирај анонимно

    Вашата адреса за е-пошта нема да биде објавена. Задолжителните полиња се означени со *