Македонец го изгради првиот ВИ модел за деловни податоци во светот – работел во Pinterest и Airbnb, а сега неговиот Kumo AI го користат најголемите компании во Силиконската долина

Вања Јосифски имал 430 модели во продукција во еден момент. 430 одделни системи за предвидување кои требало да се одржуваат, надгледуваат и подобруваат – постојано. Денес, тој е CEO на Kumo AI, компанија која изгради нешто наречено RFM – Relational Foundation Model. Со него, клиент изградил 60 модели за две недели наместо за цела година. Ова е приказна за дел од вештачката интелигенција за кој речиси никој не зборува – а кој тивко ги движи бизнисите.

Македонец го изгради првиот ВИ модел за деловни податоци во светот - работел во Pinterest и Airbnb, а сега неговиот Kumo AI го користат најголемите компании во Силиконската долина

Содржина:

Четврт век искуство со иста нерешена загатка: Вања Јосифски на чело на технолошката револуција во Силиконската долина

Вања Јосифски поминал 25 години помагајќи компании да го извлечат значењето од нивните податоци. Работел во Yahoo Research, Google Research, ја продал сопствената компанија на Pinterest, каде што бил CTO до излегување на берза, а потоа и CTO во Airbnb до нивниот IPO. “Иако имаме огромен напредок во ВИ, работата со структурни бизнис-податоци не се сменила многу во последните две децении во кои работам на ова”, вели тој. Таа константа стана изворот на Kumo AI.

Четврт век искусство со иста нерешена загатка: Вања Јосифски на чело на технолошката револуција во Силиконската долина

Бизнисите се базираат на релациони податоци, софтверот за ВИ сè уште не ги искористува целосно

Секој бизнис работи врз релациони податоци – од CRM, финансиски системи, магацини, до историја на купувања. ВИ генерално ги заобиколува овие типови податоци. „Релационите бази на податоци беа прв успешен бизнис-софтвер базиран на скала”, вели Јосифски. „Релационите податоци се природен одраз на бизнисот – имаш ентитети и имаш настани. Но проблемот е дека оваа податочна структура е позамрсена од слики и текст.” LLM заостануваат тука: „Ако се обидеш да фрлиш неколку табели во prompt на јазичен модел, резултатот е лош. Точноста е 50-60%. Традиционален ML модел на исти податоци дава 90%+. Тоа не е мала разлика.”

Бизнисите се базираат на релациони податоци, софтверот за ВИ сè уште не ги искористува целосно

Kumo RFM: Еден модел ги заменува стотиците одделни ML модели за деловни предвидувања

Традиционалниот пристап кон предвидувања во бизнисот е болен: за секоја задача се гради посебен модел. „Во едно од претходните вработувања имав 430 модели во продукција. Тоа значи 430 посебни системи кои треба да се одржуваат, да се следи дали тивко деградираат, да не паднат.” Kumo RFM работи поинаку: тоа е pre-trained foundation модел за релациони податоци. Поставуваш прашање до своите податоци, добиваш предвидување – без месеци подготовка. “Кumo RFM е еден модел за секоја предиктивна задача во претпријатието. Не мора однапред да знаеш за кој проблем ти треба.”

Kumo ги елиминира месеците рутинска работа со feature engineering и учи директно од табелите

Feature engineering одзема месеци рачна работа и бара интуиција и длабоко знаење. Јосифски го споредува ова со тоа кога во компјутерската визија пред 20 години луѓето рачно детектиралe работи и агли на слики. Денес, моделот учи директно од сурови пиксели. „Kumo учи директно од суровите релациони табели. Feature engineering е само сумарна статистика на оригиналните податоци – кога ги отстрануваш таа посредничка точка и учиш на целото множество, добиваш многу подобри резултати.” Резултат: со години усовршувани системи добиваат подобрување од 20-30%.

Тренинг само со синтетички податоци: Моќта на целосно контролираниот податочен сет

Kumo RFM е тренирана целосно на синтетички податоци. Јосифски ја користи аналогијата: „Платформата е шпоретот. Со неа можеш да ја достигнеш вистинската температура за чорбата. Но за добра чорба – потребни се вистински состојки. А тренинг-податоците се состојките.” Започнале со јавни дата сетови, но тие се ограничени. „Нè заглавија.” Решението: мутирање и генерирање синтетички податоци инспирирани од реалните. „Синтетичките податоци ти даваат моќ да одлучиш каде сакаш да одиш. Кога ќе идентификуваш недостаток – можеш веднаш да го адресираш.”

Револуционерни резултати: 60 модели за две недели наместо години чекање

Во претпријатие, само резултатите имаат значење. Клиентите на Kumo се меѓу најсофистицираните технолошки компании во Silicon Valley. “Не се отвораат врати лесно. Сè е ригорозно тестирано. Проблемите кои ги решаваме имаат директен ефект на приходите. Ако не работи – CFO го забележува брзо.” Еден клиент со 30% подобрување на нотификациите добил стотици илјади нови активни корисници месечно. Друг изградил 60 предиктивни модели за две недели, нешто што порано би траело повеќе од година. “Затоа го правам ова. Кога ќе видиш такви резултати – тоа е вистинска возбуда.”

Kumo не ги заменува LLM, туку ги надополнува и им дава сила на агентските системи

Јосифски е јасен: Kumo и јазичните модели не се конкуренти, туку надополнуваат. „LLM имаат човечко расудување. Луѓето не се добри во обработка на огромни табеларни податоци. Па ни LLM.” Kumo e дел од agentic toolbox на LLM– кога агентот треба предикција од структурни бизнис-податоци, може да ја добие директно преку MCP сервер наместо да пишува код или да халуцинира аналитика. „Kumo е фундаментален дел од она што LLM агентите ќе го користат за задачи за кои тие не се погодни.”

Содржина:

Четврт век искуство со иста нерешена загатка: Вања Јосифски на чело на технолошката револуција во Силиконската долина

Бизнисите се базираат на релациони податоци, софтверот за ВИ сè уште не ги искористува целосно

Kumo RFM: Еден модел ги заменува стотиците одделни ML модели за деловни предвидувања

Kumo ги елиминира месеците рутинска работа со feature engineering и учи директно од табелите

Тренинг само со синтетички податоци: Моќта на целосно контролираниот податочен сет

Револуционерни резултати: 60 модели за две недели наместо години чекање

Kumo не ги заменува LLM, туку ги надополнува и им дава сила на агентските системи

Коментирај анонимно

Откажи одговор