Как да расте като учен с данни

Какви умения са ви необходими, за да преминете от младши към старши разработчик

от Бен Рогоян

Снимка на Остин Дистел на Unsplash

Ролята на учен с данни все още варира от компания до компания и дори екип към екип. Това прави много по-трудно за компаниите да създадат стандартизиран план за растеж на своите учени по данни.

Без да имате ясен план за растеж, съществува риск тези талантливи компютърни магьосници да заседнат. Те могат да дадат добра представа, но всъщност никога няма да растат и да предоставят истинската възвръщаемост на инвестициите, която трябва да предложат на бизнес или по-важното - на себе си.

Имайки това предвид, нашият екип разговаря с мениджърите около Сиатъл, работещи в технологичните компании от най-високо ниво, за да разберат какво искат и очакват от своите старши учени по данни. Искахме да споделим информацията, която научихме, както за да помогнем на учените за данни да се развиват, така и да помогнем на мениджърите, които се опитват да предизвикат своите нови учени с данни да растат.

Въз основа на нашите дискусии установихме, че не става въпрос за програмиране или проектиране на алгоритми (това беше изходна точка за младши учен с данни). Когато попитахме тези мениджъри какво искат да видят от техните по-висши учени по данни, те ни информираха, че искат задвижвани хора, които могат да общуват сбито, които са способни да мислят за себе си, които имат добро разбиране на бизнеса и кои са способен да управлява.

За да расте изследователят на данни, те трябва да бъдат предизвикани извън техническите аспекти на техните работни места. Учените за данни имат възможността да променят решенията на компанията. Те носят много отговорност на раменете си. Това означава, че трябва да поемат собствеността върху работата, която вършат. Те трябва да поставят под въпрос своите източници на данни, да бъдат кратки в своите разбирания, да знаят бизнеса си и да помагат да ръководят своите лидери.

Не поставяйте под въпрос само своите открития, а поставяйте под въпрос данните си

Старши учени по данни няма да се доверят само на данните си след получаването им. Те ще го пробутат и продават за неща като пристрастия, липсващи данни, дублиращи се данни и т.н.

Данните трябва да имат странности. За тези, които прекарват часове и часове в данни, знаете какво казвам. Докато превъртате или графирате данни, виждате онези странни модели, които ви карат да спрете и да кажете „Чудя се защо x изглежда като z“. По-младите учени за данни често ще бъдат прекалено фокусирани върху довършването на проекта. Те не са се научили как да спрат и наистина да анализират тези странни модели. Тези модели могат да бъдат причинени от системи, които по подразбиране извеждат специфични данни като -1 или 1, или може би дори предубедени данни, причинени от закупуване на ботове, които биха могли да изкривят какво всъщност купуват клиентите в сайта за електронна търговия, и хиляди други вероятни причини за подвеждане данни.

Тези модели не са непременно грешни или лоши данни. Дори когато данните са точни, винаги ще има оперативни измислици. Когато проектирате отчети, алгоритми и показатели, те трябва да бъдат взети предвид. Опитен учен с данни не само ще търси тези данни, те ще ги очакват.

Терминът източник на истината се хвърля много в екипите за данни. Той се отнася до първоначалния източник на данни, който множество екипи са решили, че е правилен. Бях много наивен, когато започнах да се занимавам с данни. При един от първите ми проекти бях информиран за източник на данни, който нашият екип е определил като източник на истината. Месеци наред работех върху нашия „Източник на истината”, разработвайки анализи и приложения, за да помогна на над 200 мениджъри и директори да имат достъп до тези данни. Разбира се, не мина много време, докато не възникнаха проблеми с съгласуваността с други показатели. Тогава разбрах, че работя върху източник на данни няколко ETL от източника на истината.

Говоренето с технически ръководители в Сиатъл е често срещан проблем. Младите анализатори, учени и разработчици на данни прекалено се доверяват на своите източници на данни. Обикновено по-младите, по-малко опитни служители ще бъдат много нетърпеливи да свършат работата. Това по невнимание ще доведе до по-малко разбиране за това какво всъщност представляват данните. Вместо да питат защо, те отделят повече време за осигуряване на функциите на продукта. По този начин те пропускат да забележат странни данни.

За да се развиете като учен с данни, трябва да се откажете от просто да се уверите, че продукт или алгоритъм „отговаря на изискванията“ и да поемете собственост. Трябва да поемете отговорност за разбирането на данните и техните странности. По този начин можете да съобщите напълно на вашия мениджър или директор всички и всички предположения, които сте направили. Учен с данни не може наистина да расте, ако обвинява лошите резултати на данните.

Бъдете в състояние да заявите кратко стойността на своите констатации

За да се развиете като учен с данни, трябва да се разширите, освен да сте програмист / статистик. Трябва да се научите как да бъдете комуникатор и трябва да придобиете способността да изрично да заявите стойността на своите констатации, както и да посочите какво трябва да прави вашият директор с информацията.

Може да е изкушаващо да предоставим на директорите и мениджърите всички графики, всички данни и цялата техническа информация, събрана по време на нашето изследване, за да докажем, че всъщност работим. Особено в науката за данните, където понякога са необходими няколко месеца, за да се направи полезен напредък по един-единствен проблем (по уважителна причина). В края на всичко това обаче режисьорите не искат излишна информация.

Всичко, което режисьорът иска, са важните точки и те искат да знаят какво трябва да правят въз основа на тези точки. Продължаването на ROC и защо сте използвали един алгоритъм срещу друг няма да бъде много полезно за мениджър или директор с 8 други екипа за управление. През повечето време установяваме, че мениджърите наистина искат 2–3 кратки точки. Понякога дори само „Да“ или „Не“ е по-добро от „Може би, при тези условия… бла-бла… възможността човек има тези рискове, възможност две има тези рискове…“

Опитни учени с данни знаят как да помогнат на своя мениджър, като предоставят излъскана информация, с дестилирани елементи за действие. Ако мениджърът иска да знае повече, те ще попитат (и добър учен с данни ще има отговор). В крайна сметка мениджърите не искат да бъдат заливани с допълнителна информация, която няма да им помогне да вземат добри решения.

Познайте бизнеса си

Всеки път, когато информатологът започне нова работа, разбираемо е, че те няма да разберат всичко за новия работен ден. Има какво да научим освен източници на данни, бази от кодове и други специфични за компанията системи. Те трябва да се запознаят с оперативния ден на данните, с които ще работят. Те също трябва да разберат проблемите, пред които е изправена компанията. Опитните учени с данни обаче трябва да могат бързо да придобият разбиране за бизнес.

Не се фокусирайте толкова върху натрупването на техническите си умения, че да не успеете да научите бизнеса. Научете как да работите с различни екипи, участвайте в проекти и си позволете да бъдете старателно наставлявани. Данните учени могат да бъдат включени в проект след проект по множество различни видове теми и те трябва да могат да се адаптират бързо.

Младши разработчици често ще бъдат много по-фокусирани върху усъвършенстването на техническите си умения спрямо тяхното разбиране от бизнеса. Подобно на много други сделки, където грунтовата работа (в случая кодиране, изчистване на данни и т.н.) се извършва на по-ниски нива. Това не им оставя време да придобият задълбочено разбиране за това как могат да помогнат на бизнеса.

Това обаче е важна фаза в ранните години на учен с данни, за да се гарантира, че те изграждат широк набор от технически умения. По-опитните учени трябва да се съсредоточат повече върху причините за своите проекти. Ако мениджърът не предизвика своите по-опитни членове от екипа за научни данни да развиват и учат бизнеса, то донякъде тяхната вина е липсата на растеж. Всяка година или на всеки няколко месеца мениджърите трябва да помагат да предизвикат по-опитните учени с данни, за да се уверят, че те наистина нарастват. В противен случай бизнес губи при максимална възвръщаемост на инвестициите.

Управление на

Управлението е трудно във всяка дисциплина. В техническите дисциплини понякога може да е трудно, в зависимост от техническия опит на ръководителите. Бизнес ориентираните мениджъри може да нямат опит да ръководят технически екипи. Това прави изключително важно за опитни учени с данни да имат умения да управляват.

Учен с данни, който е добър в управлението, разбира хората. Управлението изисква данни на учените от данни (или някой във всяка компания по този въпрос) да отдели време, за да разбере нуждите на шефовете. Не само нуждите на компанията. Какво иска шефът от вас и от тях самите? След като разберете това, разбирате какво ги движи. Това ще позволи на ученият по данни да предвиди нуждите на своите шефове преди да бъде попитан. Това ще помогне за развитието на доверие, както и за по-нататъшни инвестиции от вашите мениджъри и директори. Този свят не е свързан само с вашия растеж. Мениджърите искат също да растат! Като опитен (всеки) знаете, че да помогнете на другите да растат и да постигнат целите си, означава и вие да спечелите.

резюме

Очаква се учените на данни да правят повече от просто създаване на алгоритми и управление на големи масиви от данни. Стойността на опитните учени за данни идва не само от техническите им способности, но и от уменията им за мек отцед. Информацията и алгоритмите, които учените създават, ще тласнат решенията на висшите ръководители. По този начин, всичко, което предоставят, трябва да бъде разбираемо от директори и вицепрезиденти, които управляват милиони до милиарди долари хора, ресурси, оборудване, проекти ... и всичко останало в една компания. Това означава, за да може ученият с данни да нарасне в полза на бизнеса, той трябва да научи какво бизнесът ще намери за ценен.