10 bieži uzdotie datu zinātnieku intervijas jautājumi

Datu zinātnes joma arvien attīstās, aptver vairākas nozares un prasa plašu prasmju kopu, kas ietver matemātiku, statistiku, programmēšanu un mārketingu. Tāpēc, lai kļūtu par datu zinātnieku, ir nepieciešams iespaidīgs tehnisko prasmju, radošuma un komunikācijas apvienojums.

Datu zinātnieku darba apraksti var ievērojami atšķirties, lai gan visi meklē kandidātus ar garu vēlamo darba prasmju sarakstu, piemēram, kritisko domāšanu, problēmu risināšanu, datu analītiku, emocionālo inteliģenci, uzmanību detaļām un komandas darbu. Tas nozīmē, ka intervijas jautājumi datu zinātniekiem var aptvert vairākas atšķirīgas tēmas un variēt no tipiskiem vieglo prasmju jautājumiem līdz ārkārtīgi tehniskām diskusijām.

Datu zinātnes intervijas prasa daudz sagatavošanās. Neatkarīgi no tā, vai esat svaigs no labākajām datorzinātņu skolām vai arī vēlaties pāriet uz citu uzņēmumu vai nozari, jums vajadzētu veltīt laiku, lai pārdomātu galvenās darba koncepcijas. Tāpat kā jūs zināt, kā vadīt automašīnu, bet jums var būt grūtības atkārtot noteiktus ceļu satiksmes noteikumus, jūs varētu iestrēgt intervijā, mēģinot formulēt, kā darbojas konkrēts algoritms.

Lai palīdzētu jums sagatavoties, mēs esam apkopojuši 10 visbiežāk izmantotos datu zinātnieku interviju jautājumus. Sākot no seansiem līdz otrā un trešā posma video un intervijām uz vietas, jūs sastapsities ar ļoti daudziem eksāmeniem, piemēram, ar savām tehniskajām prasmēm, komunikācijas spējām un darba stilu.

1. “Pastāstiet mums vairāk par jaunāko projektu jūsu portfolio.”

Datu zinātnieki ir pieprasīti daudzās dažādās nozarēs, taču uzņēmumi bieži meklē kādu ar ļoti specifiskām prasmēm, kā arī labu kultūras kultūru. Sīks tiešsaistes portfelis, kurā parādīts darba veids, kurā jūs esat spējīgs, kā arī spēcīga klātbūtne sociālajos medijos un personīgais zīmols palīdz jums izcelties no citiem kandidātiem, kā arī savienot jūs ar vadītāju un darbā pieņemšanas darbinieku pieņemšanu darbā, kas jums ir perfekts. piemērots.

Esiet gatavs jebkurā datu zinātnes intervijā, lai plaši runātu par visiem jūsu CV, portfeļa vai vietnes elementiem. Pielāgojiet savai auditorijai jūsu reakciju par projektu. Ja tas ir sākotnējais skrīnings vai panelis, kurā piedalās dalībnieki no dažādiem departamentiem, jums galvenā uzmanība jāpievērš tam, kā jūsu darbs ir devis pozitīvus rezultātus klientam un viņa biznesam.

Kad nokļūsit tajā intervijas procesa daļā, kurā jūs tiekaties ar citu datu zinātnieku, inženieri, analītiķi vai citu tehnisku personu, ir nepieciešams sīkāks datu un procesu apraksts, kas saistīti ar jūsu darbu.

2. 'Kāpēc jūs vēlaties strādāt šajā uzņēmumā?'

Pat ja ar jums sazinājās tieši caur savu tiešsaistes portfeli vai LinkedIn profilu un uzaicināja uz interviju atklātam amatam, uzņēmums joprojām vēlēsies uzzināt, kāpēc jūs esat pieņēmis un kāpēc, jūsuprāt, jūs labi derēs šim darbam.

Sagatavojoties intervijai, papildus tehnisko iemaņu uzlabošanai jāietver arī pētījumi par uzņēmējdarbību, uz kuru piesakāties. Informācija par viņu nozari, misiju, darbiniekiem, tieši to, ko viņi dara, un cik labi viņi to dara, palīdzēs jums izveidot īpaši pielāgotu atbildi uz šo jautājumu.

Runājiet par to, kā jūsu prasmju kopa palīdzēs viņiem sasniegt savus mērķus. Atrodiet veidu, kā izteikt aizraušanos ar vienu vai vairākiem jūsu darba lomas aspektiem, ieskaitot uzņēmuma misiju, filozofiju, jauninājumus vai produktu līniju. Ja tas ir jūsu sapņu darbs, var būt vērts laiku, lai pirms intervijas saliktu datu zinātnes projektu, kas viņiem atrisina problēmu, piemēram, pievilcību jauniem demogrāfiskiem datiem vai piegādes plānošanu efektīvāk.

3. “Nosauciet datus, kurus zinātnieki visvairāk apbrīno, un paskaidrojiet, kāpēc.”

Lai gan tas ir ļoti personisks jautājums, uz kuru tehniski nav pareizas atbildes, jūsu izvēlētās atbildes ir ļoti svarīgas. Jūsu pētījumi par uzņēmumu, kā arī interviju paneļa pētījumi var palīdzēt jums radīt labu pirmo iespaidu tikai ar šo jautājumu.

Zinot cilvēkus, kuri ir pamanāmi šajā jomā, kā arī tos, kuri šobrīd veido viļņus, intervētājiem parādīsit, ka jūs esat zinoši un aizrautīgi darbojušies šajā nozarē. Ir noderīgi apspriest datu zinātniekus, kuri tiek novērtēti konkrētajā karjeras jomā, kurai piesakāties, piemēram, finansēs, medicīnā vai akciju tirgū.

Šis jautājums ir vairāk nekā tikai iespaidīgs vārdu saraksts. Vienādojuma “kāpēc” daļa parādīs arī topošajiem darba devējiem, ko jūs novērtējat savā jomā un kā jūs darbosities. Ja jūsu pētījums parādīja, ka uzņēmums vērtē jauninājumus, integritāti vai pat noteiktu statistikas metodi, šī ir lieliska iespēja paziņot viņiem, ka jums ir tās pašas vērtības.

4. 'Kā jūs izskaidrotu ieteikumu programmu kādam no mārketinga nodaļas?'

Viena no svarīgākajām īpašībām, kas datu zinātniekus atšķir no citiem tehniskajiem ģēnijiem, ir spēja pārveidot, parādīt un izskaidrot datus tādā veidā, kas cilvēkiem nav saprotams. Tas padara vaicājumu, piemēram, šo par vienu no vissvarīgākajiem datu zinātnieku intervijas jautājumiem, ar kuru jūs sastapsities. Intervētāji vēlas redzēt, cik labi jūs varat sazināties ar tādām koncepcijām kā datu modelēšana, lēmumu koki un lineārā regresija jebkurai auditorijai.

Šajā konkrētajā gadījumā vispirms vēlēsities vienkāršā veidā izskaidrot, kā darbojas ieteikumu motors, norādot gan satura, gan sadarbības filtrēšanas piemērus. Tad jūs vēlaties apspriest, kā jūs varat strādāt ar mārketinga nodaļu, lai apvienotu viņu prasmes pievilināt klientus ar algoritma jaudu, kas izmanto apkopotos datus, lai palīdzētu precīzi noteikt, ko patērētāji vēlas.

5. 'Kādas ir atšķirības starp kontrolētu un nepārraudzītu mācīšanos?'

Jūs varat sākt, apkopojot, ka galvenā atšķirība starp šīm divām ir tā, ka uzraudzītai mācībai ir apmācības dati, no kuriem algoritms var mācīties, un sniegt atbildes. Nepietiekamai apmācībai ir nepieciešams grupēt lietas pēc līdzībām, kopīgām anomālijām un citiem modeļa meklēšanas procesiem, nevis pēc grūti un ātri iegūtiem datiem.

Intervētājs vēlēsies, lai jūs iedziļinātos sīkumos, tāpēc ir svarīgi uzskaitīt īpašās atšķirības un spēt runāt par dažādiem izmantotajiem algoritmiem.

Pārraudzīta mācīšanās

  • kā ievadi izmanto zināmus un marķētus datus
  • ir atgriezeniskās saites mehānisms
  • izmanto prognozēšanai
  • tās kopējie algoritmi ietver lēmumu koku, loģistikas regresiju, lineāro regresiju, atbalsta vektora mašīnu un izlases mežu

Nepietiekama apmācība

  • kā ieeju izmanto nemarķētus datus
  • nav atgriezeniskās saites mehānisma
  • izmanto analīzei
  • tās kopējie algoritmi ietver K-līdzekļu klasterēšanu, hierarhisko klasterizēšanu, autoenkodētājus un asociācijas noteikumus

Vēlaties, lai būtu daži piemēri - gan vispārīgi, gan arī no konkrēta projekta, pie kura strādājāt -, lai parādītu atšķirības starp šiem diviem mašīnmācīšanās veidiem un to, kādos gadījumos katrs varētu tikt izmantots. Piemēram, nepienācīgas mācības var izmantot, laižot klajā jaunu produktu, ja nav zināma klienta demogrāfija, kurai tas varētu patikt.

Abonēt

Pierakstieties mūsu biļetenā, lai iegūtu vairāk satriecoša satura un saņemtu 20% atlaidi mūsu karjeras pārbaudei!

Abonēt

6. 'Kā izvairīties no izvēles neobjektivitātes?'

Šis jautājums datu zinātnes intervijā var izpausties dažādos veidos. Jums var lūgt definēt atlases neobjektivitāti, kā no tā izvairīties vai sniegt konkrētu piemēru, kā tā spēlēja lomu projektā, kurā strādājāt.

Galvenā problēma saistībā ar atlases neobjektivitāti ir tā, ka secinājumi ir izdarīti no nejaušas izlases. Acīmredzot vienkāršākais risinājums ir vienmēr izvēlēties no skaidri definētas populācijas izlases veida. Jums būs jāprecizē, kāpēc tas ne vienmēr ir iespējams.

Jāapzinās, ka, tā kā atlases novirzes var būt tīšas - ar priekšmeta atlasi vai datu atdalīšanu mērķtiecīgi veicot priekšnoteikuma teorijas vai projekcijas pierādīšanu - tas varētu būt netiešs veids, kā iznomāšanas komisija uzdod kādam no grūtākajiem intervijas jautājumiem par darba ētiku un integritāti. .

Galu galā jūs vēlaties uzsvērt, kā atlases neobjektivitāte biežāk ir nejauša vai nenovēršami neobjektīva informācija. Noteikti aprakstiet dažas no jomām, kurās var rasties atlases novirzes, ieskaitot paraugu ņemšanu, laika intervālu, datus un nodilumu. Pēc tam sniedziet dažus piemērus, kā sviras efekta paņēmieni, piemēram, atkārtota paraugu ņemšana un palielināšana, var palīdzēt jums novērst nejaušās izlases.

Ja atrodaties intervijas laikā, kad runājat ar mazāk tehnisko departamentu pārstāvjiem, izmantojiet viegli sagremojamu piemēru, kas skaidri parāda atlases neobjektivitāti. Datu zinātnieks Ēriks Holingsvorts atsaucas uz mācību, kas gūta no putnu gripas uzliesmojuma 2011. gadā, kad “apstiprinātu gadījumu” statistiskajā paraugā tika ieskaitīti tikai ļoti slimi indivīdi. Rezultātā 80% ziņoja par mirušo skaitu, kas bija tik šausmīgs atlases neobjektivitātes dēļ, un radīja ievērojamas plašas bailes.

7. 'Kā var izturēties pret ārējām vērtībām?'

Šis ir parasts intervijas jautājums datu zinātniekiem, jo ​​tas atklāj, kā jūs izmantojat dotos datus, metodes, kuras izmantojat šo datu apstrādei, un to, vai esat gatavs veltīt laiku, lai novērtētu katru no šiem datiem.

Vispirms vēlēsities runāt par to, kas veido novirzi, jo skaitļi, kas ārpus diagrammas atrodas ārpus datu kopas, kā 2–3 standarta novirzes no vidējā utt. Nākamais solis darījumos ar novirzēm ir novērtēt, kāpēc tie notikuši.

Neliels daudzums novirzīšanās, ko var attiecināt uz vienkāršām cilvēku vai mašīnu kļūdām, ir viegli novēršams. Tomēr noteikti ņemiet vērā, ka pat atsevišķs izņēmums var būt galvenais datu punkts, nevis problēma, jo tas var liecināt par vienotas mārketinga taktikas, jaunas zāļu sastāvdaļas vai produktu līnijas panākumiem.

Tālāk jūs vēlēsities izskaidrot, kā rīkoties ar lielu skaitu noviržu, kam nepieciešami sarežģītāki risinājumi. Piemēram, jums, iespējams, vajadzēs mainīt izmantoto modeli, normalizēt datus uz vidējo vai izmantot izlases meža algoritmu. Vēlreiz mēģiniet izmantot reālās dzīves gadījumu no savas pieredzes kā datu zinātnieks, lai izskaidrotu pareizo taktiku.

8. “Kāpēc datu tīrīšana ir svarīga?”

Datu vākšana un tīrīšana ir galvenā datu zinātnieka darba daļa, kas aizņem līdz 80% no jūsu laika. Neatkarīgi no tā, kurā nozarē jūs izmantojat, intervijas jautājumos vienmēr būs viens par to, kāpēc datu tīrīšana ir svarīga. Intervētāji jautās arī par jūsu izvēlētajām tīrīšanas metodēm un programmām.

Jums jāuzsver, cik tīri dati ir nepieciešami, lai izdarītu pareizus secinājumus, bet tas attiecas ne tikai uz skaitļiem. Paskaidrojiet, kā, sākot ar pilnīgiem, precīziem, derīgiem un vienotiem datiem, tieši ietekmē viņu biznesu. Galvenie ieguvumi, par kuriem diskutēt, ir šādi:

  • uzlabota lēmumu pieņemšana par uzņēmuma mērķiem
  • ātrāka klientu iegūšana un iepriekšējo klientu atkārtota mērķauditorijas atlase
  • laika un resursu ietaupījums, kas saistīts ar kļūdainu vai dublētu datu novēršanu
  • uzlabota produktivitāte
  • paaugstināta komandas morāle, pateicoties atkārtotiem efektīviem un precīziem rezultātiem

9. 'Kāds ir A / B pārbaudes mērķis?'

Jautājumi par A / B pārbaudi jūsu intervijas laikā par datu zinātnieka amatu var sākties ar vispārīgāku atsauci uz eksperimentāla dizaina izmantošanu, lai atbildētu uz vienu vaicājumu par lietotāja rīcību vai vēlmēm. Vietnes, lietotnes vai biļetenu dizaina mainīgā lieluma testēšanas mērķis ir vienkārši novērtēt, vai izmaiņas palielinās interesi, iesaistes un reklāmguvumu līmeņus.

Viens veids, kā norobežoties, atbildot uz šāda veida intervijas jautājumiem, ir apspriest, kā citi datu zinātnieki varētu izdarīt nepareizus secinājumus no A / B testēšanas. Starp iespējamām kļūdām var minēt:

  • pietiekami ilgā laika posmā netiek savākti pietiekami daudz datu
  • Pārbaudot pārāk daudz mainīgo vienlaicīgi
  • netiek uzskaitīti ārējie faktori, kas testēšanas laikā var ietekmēt satiksmi
  • ignorējot nelielus ieguvumus, kas laika gaitā var pieaugt, un apvienojot tos ar citām pozitīvām izmaiņām, lai palielinātu ieņēmumus
  • trūkst plašu attēlu interpretāciju, piemēram, tīrie finanšu ieguvumi vai zaudējumi attiecībā pret konvertācijas likmēm

Papildus šo problēmu norādīšanai jums būs jāizsaka, kā jūs tās atrisinātu - vai, vēl labāk, kā jūs jau esat izvairījies no tām iepriekšējos datu zinātnes projektos.

10. “Jums ir 48 stundas, lai atrisinātu šo kodēšanas problēmu.”

Kodēšanas izaicinājums var būt sākotnējais veids, kā pārbaudīt potenciālos datu zinātniekus, vai arī tas var būt otrais solis intervijas procesā pēc tam, kad esat novērsis pirmo šķērsli pie personāla atlases vai nolīgšanas vadītāja. Tas var būt pārbaude uz vietas, kas ilgst no 30 minūtēm līdz 2 stundām, ja jūs kodējat uz tāfeles vai tastatūras intervētāja skatījumā. Jums bieži tiek dota valodas izvēle, taču esiet gatavs kodēt SQL vai Python.

Daži uzņēmumi piešķir garākus uzdevumus ar termiņu līdz nedēļai. Tāfeles izaicinājumiem var būt nepieciešams uzrakstīt diezgan vienkāršus SQL vaicājumus, taču garāki testi, protams, ir sarežģītāki. Parasti jums tiek doti dati un viņiem tiek lūgts veikt īpašas prognozes, izmantojot šos datus, un jums būs jāparāda savs darbs. Piemēram, nesen datu zinātnieku intervijas subjektam tika sniegti Airbnb dati un viņš tika lūgts paredzēt māju cenas, pamatojoties uz izmitināšanas iespējām.

Intervētāji vēlēsies ar jums pārrunāt jūsu izvēli, izdarītos pieņēmumus, izvēlētās funkcijas, kādēļ izmantojāt noteiktus algoritmus un daudz ko citu. Bieži vien jūsu saņemtā atbilde nav tik svarīga kā process, radošums, koda lasāmība un dizains.

Šī var būt nervus satraucoša intervijas pieredze, tāpēc sagatavojieties pats, izveidojot un pabeidzot prakses kodēšanas izaicinājumus kopā ar draugiem vai kolēģiem datu zinātnes jomā. Kodēšanas vingrinājumiem varat arī apmeklēt vietnes, piemēram, Leetcode un SQLZOO. Faktiskās izspēles intervijas, kurās iesaistītas algoritmiskas un sistēmu projektēšanas problēmas, bez maksas ir pieejamas vietnē Interviewing.io.

Kā redzat, intervijas jautājumi datu zinātniekiem var būt sarežģīti, un kopējais process var būt garš un šausminošs. Viens no vissvarīgākajiem intervijas padomiem ir palikt pozitīvs, pat ja jūtaties, ka daļa no intervijas procesa noritēja slikti. Mēs bieži esam smagāki par sevi nekā citi, un jūs joprojām varētu nolaisties, neskatoties uz to, ka nesaņemat katru atbildi tik perfekti, kā jūs būtu gribējis.

Ja jūs garām iespēju izmantot, jautājiet atsauksmes un izmantojiet to, lai uzlabotu nākamās intervijas pieredzi. Galu galā daudzi vispāratzīti datu zinātnieki tika noraidīti no vairākām pozīcijām un joprojām turpināja gūt panākumus darbos, kuri galu galā bija labāk piemēroti!

Ar kādiem jautājumiem un kodēšanas problēmām jūs saskārāties, mēģinot piezemēties datu zinātnes darbā? Pievienojieties diskusijai zemāk esošajos komentāros un palīdziet citiem datu zinātniekiem sagatavoties nākamajai intervijai!

Atstājiet Savu Komentāru

Please enter your comment!
Please enter your name here