?ultrasound
ultrasound發(fā)音
英:[??ltr?sa?nd] 美:[??ltr??sa?nd]
英: 美:
ultrasound中文意思翻譯
n.超聲(波)
ultrasound常見(jiàn)例句
1 、Prenatal ultrasound screening is one of the effective means of intervention for birth defects control.───產(chǎn)前超聲篩查是干預(yù)胎兒出生缺陷的有效手段之一。
2 、DUFFY HASKELL: And stole the alien baby. That ultrasound is proof.───并且偷走了外星嬰兒。那超聲波可以證明。
3 、In duplex Doppler ultrasound, malignant tumors display more abundant blood flow within and higher resistance index.───在雙功能多普勒超聲中,惡性腫瘤內(nèi)部血流更為豐富,阻力指數(shù)(ri)較高。
4 、Maybe you should have done the ultrasound.─── 或許你應(yīng)該先做超聲波掃描
5 、Objective To summarize the experiences of automatic kidney-biopsy guided by ultrasound.───摘要目的總結(jié)超聲引導(dǎo)自動(dòng)腎活檢的經(jīng)驗(yàn)。
6 、When we did the ultrasound, we noticed this.─── 我們做超聲波檢查的時(shí)候發(fā)現(xiàn)了這個(gè)
7 、Methods 23 cases children of surgical proven acute osteomyeliti s had ultrasound,X-ray and CT exams.───方法23例小兒急性骨髓炎患者均經(jīng)穿刺手術(shù)病理證實(shí),術(shù)前全部患者行X-線(xiàn)平片、增強(qiáng)CT和超聲檢查。
8 、The phantom study inspection first choice uropoiesis is a ultrasound.───影像學(xué)檢查首選泌尿系b超。
9 、The initial investigation included chest X-ray and chest ultrasound.───剛開(kāi)始的檢查包括胸部X光及超音波檢查。
10 、It is not rare to run into the image of a child with his thumb in his mouth against the blurred light of an ultrasound.───一個(gè)小孩的圖像與他的拇指在他的嘴巴里反抗著對(duì)超音波模糊的光線(xiàn)并不是稀奇的。
11 、Scanditronix Wellh?fer GmbH offer to you Ultrasound therapy and Radiation meters in addition also Info on Radiotherapy.───的業(yè)績(jī)不僅在于廣泛的服務(wù),還包括放射療法業(yè)務(wù)。
12 、A study of fundus blood flow parameters with color doppler ultrasound in hypertensive patients.───彩色多普勒對(duì)高血壓病眼底動(dòng)脈血流的研究。
13 、In recent years, the study on the degradation of organic pollutants in water by ultrasound is very active.───摘要近年來(lái),超聲降解水體中有機(jī)污染物的研究十分活躍。
14 、The two-dimensional and three-dimensional ultrasound showed a fetal ovarian tumor(5.0×4.7×4.4 cm) with cystic shadow.───病例報(bào)告:一個(gè)十九歲女性,在妊娠三十四周時(shí)因疑胎兒腹腔囊腫來(lái)院求診。
15 、Methods:The female partners were routinely superovulated and underwent oocyte retrieval under vaginal ultrasound.───方法:女性行常規(guī)超促排卵和經(jīng)**超聲引導(dǎo)下取卵。
16 、Methods Guided by high-frequency ultrasound,infusing high glucose to treat thyroid cyst.───方法利用高頻超聲探頭引導(dǎo),穿刺抽吸注入高糖治療甲狀腺囊腫。
17 、All cases received ultrasound and CT before operation, in whom 11 (73.3%) got final diagnosed .───15例患者術(shù)前均行B超和CT檢查,術(shù)前確診11例(73.3%)。
18 、Special eye sing,ultrasound scanning,CT,digital subtraction angiography(DSA) is an effective methods to diagnose CCF.───特征性眼部表現(xiàn) ,超聲、CT、選擇性全腦數(shù)字減影血管造影 (DSA)是診斷CCF的有效方法。
19 、More pregnant women receive a first-trimester ultrasound exam, the only way to be certain of the fetus' exact age.───更多**婦女要接受三個(gè)月一次的超音波檢測(cè),唯一辦法就是確認(rèn)胚胎的確切年紀(jì)。
20 、Natural pigment in grain layer of goat skin and pig skin was bleached by hydrogen peroxide and ultrasound.───探討了采用過(guò)氧化氫及超聲波除去山羊皮及豬皮粒面層色素的方法。
21 、We waited three hours to have an ultrasound confirm her theory.───我們等著超聲波出來(lái)做進(jìn)一步確認(rèn),足足等了3個(gè)小時(shí)。
22 、Bernard: So you aren't going to purchase an ultrasound machine to use at home?───伯納德:所以??們不會(huì)買(mǎi)超音波機(jī)器在家里用羅?
23 、This paper introduces a real-time monitored control system used in Ultrasound Hyperthermia Instrument.───本文介紹了一種用于超聲治癌熱療儀的實(shí)時(shí)監(jiān)控系統(tǒng)。
24 、Some molecules are designed to break open when exposed to heat, ultraviolet light or ultrasound.───一些分子,是為了打開(kāi)暴露在高溫,紫外線(xiàn)光或超聲波檢查。
25 、We specialize in Eddy Currents, Laser/Optics, Ultrasound and Radiology testing methods.───我公司在渦流、激光/光學(xué)、超聲波和放射試驗(yàn)方法方面具有專(zhuān)長(zhǎng)。
26 、Metheds 31cases with trauma of tendo calcaneus were examined with high frequency ultrasound.───方法應(yīng)用高頻超聲檢查31例跟腱損傷。
27 、Can the WHO definition of osteoporosis be applied to multi-site axial transmission quantitative ultrasound?───世界衛(wèi)生組織對(duì)骨質(zhì)疏松癥的定義能適用于多部位定量超聲儀嗎?
28 、METHODS: Thirty three patients with parenchyma mass in liver had automatic biopsy for histology by ultrasound guiding.───方法:對(duì)33例有肝臟實(shí)質(zhì)性占位病變的患者在超聲引導(dǎo)下行肝腫塊穿刺組織自動(dòng)活檢術(shù)。
29 、The ultrastructure change of villus cells can be induced by ultrasound at 5 MHz for 10 min.───孕早期接受一定劑量(5 MHz,10 min)的超聲輻照能夠?qū)е陆q毛細(xì)胞超微結(jié)構(gòu)發(fā)生改變。
30 、And we feel the ultrasound is unnecessary.─── 我們認(rèn)為超聲檢查沒(méi)有必要
31 、Months later they saw the fetus in an ultrasound.───幾個(gè)月以后,他們通過(guò)超聲波看到了胎兒。
32 、Study on the Biological Effect of Ultrasound in Nicotiana Tabacum L.───煙草超聲生物學(xué)效應(yīng)的研究
33 、B ultrasound or X radiate revealed residnal calculus in 6 patients, the diameters were less than 0.6cm.───40例術(shù)后2個(gè)月~1年內(nèi)復(fù)查B超或X線(xiàn),6例殘留小結(jié)石,直徑均
34 、Animal Experiment in Catheter Ablation at The Vein Orifices Into The Heart by Ultrasound.───入心靜脈口環(huán)狀超聲消融動(dòng)物實(shí)驗(yàn)。
35 、Ultrasound by definition is sound that lies beyond the range of human hearing.───從定義來(lái)看,超聲波是一種超出人類(lèi)聽(tīng)覺(jué)范圍的聲音。
36 、Take this chart down to ultrasound for me.─── 把這個(gè)表格送去超聲檢查科
37 、Nine infertile women were dynamically observed by ultrasound B.Eachwoman was observed for two ovulatory cycles.───用實(shí)時(shí)超聲動(dòng)態(tài)監(jiān)測(cè)9例不孕婦女卵泡發(fā)育及排卵,每例監(jiān)察2個(gè)排卵周期,其中3例無(wú)排卵周期婦女在B超監(jiān)測(cè)下實(shí)行藥物誘導(dǎo)治療。
38 、Ultrasound tests have become a common part of most pregnancies.───照超音波大多已成為**過(guò)程中常見(jiàn)的一部分了。
39 、I can't find it. I need the ultrasound.─── 我找不到血管 給我一個(gè)超聲波
40 、A large Liquid Crystal Display displays both the live ultrasound waveform and the thickness reading.───大型液晶顯示器,可顯示動(dòng)態(tài)超聲波波形以及厚度測(cè)量的讀數(shù);彩色鍵盤(pán)及數(shù)字按鍵,使其操作非常直觀。
41 、Applied Sonochemistry: Uses of Power Ultrasound in Chemistry and Processing.───字體:小中大|打印發(fā)表于:2008-6-0301:22作者:超聲波來(lái)源:萬(wàn)客在線(xiàn)
42 、I found the ultrasound and confronted her.─── 是我找到了這張照片去質(zhì)問(wèn)她
43 、ZHEJIANG PROVINCIAL ULTRASOUND MEDICAL POST.───浙江省超聲醫(yī)學(xué)專(zhuān)業(yè)崗位培訓(xùn)中心。
44 、Value of Color Scale Ultrasound in the Diagnosis of Abdominal Lesions.───彩階B超對(duì)腹部病變的診斷價(jià)值
45 、Objective To explore the value of ultrasound biomicroscope (UBM) in diagnosis and treatment of ciliary body dialysis.───摘要目的探討超聲生物顯微鏡(UBM)在挫傷性睫狀體脫離的診斷和治療中的臨床意義。
46 、Take an X ?ray of your chest, then have an ultrasound examination.───做個(gè)胸部透視,然后進(jìn)行超聲波檢查。
47 、Ultrasound showed that in 45 the abnormal echo were 33(73.3%).───B超檢查 45例 ,異?;芈暩淖?33例 ( 73.3% ) ;
48 、As sharp as she was in TWW, she rocked out the ultrasound technician this time.───“爸比,你問(wèn)的是什么照片?”“美女呀,外國(guó)的!”“能再具體點(diǎn)嗎?”
49 、I want you to have blood tests, X-rays, kidney function tests and an ultrasound examination.───我需要你做血液化驗(yàn)、X線(xiàn)檢查、腎功能試驗(yàn)和超聲波檢查。
50 、Ultrasound clean equipment, autoclave, hot-air steriliser and IR heater, etc.───可有超聲波清洗設(shè)備、高壓滅菌設(shè)備、干烤滅菌箱、紅外烤箱等。
51 、Three lesions were all detected by color Doppler ultrasound and were proved by renal angiography.───三個(gè)病灶皆由都卜勒超音波所偵測(cè)到,并以動(dòng)脈攝影術(shù)作最終的診斷。
52 、Method:The TNM stages of the carcinoma of cervical esophagus in 24 cases were studied with high frequency ultrasound.───方法:應(yīng)用經(jīng)頸高頻探頭超聲對(duì)24例頸段食管癌進(jìn)行了TNM分期的研究。
53 、Total Solution to Ultrasound Hi-Tech Field!───博大精深的超聲波行業(yè)科學(xué)技術(shù)解決之道!
54 、The SPD and BPD measured by ultrasound would be method for diagnosis of cephalopelvic disproportion in childbearing.───臨產(chǎn)前超聲測(cè)量胎兒雙頂徑及孕婦骨盆骶恥徑可作為產(chǎn)前頭盆不稱(chēng)篩查的檢測(cè)方法而值得臨床應(yīng)用。
55 、The ultrasound revealed that you have a teratoma.─── 超聲波掃描檢查顯示你有個(gè)畸胎瘤
56 、Ultrasound investigation revealed diaphragmatic hernia with intrathoracic cystic mass.───此次超聲檢查發(fā)現(xiàn)膈疝和胸腔內(nèi)的囊性團(tuán)塊。
57 、To Evaluate the Effect of Alcohol Injection for Liver Cancer by Color Doppler Ultrasound.───彩色多普勒超聲評(píng)價(jià)肝癌酒精治療的療效。
58 、This paper studies the degradation of low concentration Acid Brilliant Scarlet GR by ultrasound.───本文研究了用超聲波降解低濃度酸性大紅GR染料廢水。
59 、Keywords: ultrasound, achilles tendon, mechanical properties, resonant frequency.───關(guān)鍵詞:超音波、阿基里斯腱、機(jī)械特性、共振頻率。
60 、Okay, you've been through the ultrasound drill.─── 那好 你是做過(guò)超聲探針的
61 、Our leading edge technologies include ultrasound, ultrasound phased array, eddy current, and eddy current array.───我們的前沿技術(shù)包括常規(guī)超聲、超聲相控陣、渦流以及渦流陣列。
62 、Abstract: Objective To discuss the ultrasound findings of nephrocalcinosis caused by vitamin D intoxication.───文章摘要: 目的探討維生素D中毒腎鈣質(zhì)沉著的超聲表現(xiàn)。
63 、No specific signs were found with IVU or B ultrasound check.───IVU及B超檢查未做出特異性診斷提示。
64 、Methods The ultrasound images in 26 patients were compared with CT and MRI retrospectively.───方法 回顧性分析2 6例微泡型多囊肝的聲像圖表現(xiàn)并與CT、MR圖像進(jìn)行對(duì)照。
65 、The walnut oil was extracted by Soxhler extractor and Ultrasound methods with ether and n-hexane as solvents.───分別以乙醚、正己烷為溶劑,采用索氏提取法和超聲波提取法對(duì)核桃仁中的核桃油進(jìn)行提取。
66 、The ureterocele was easily detected by ultrasound and usually revealed as a cystic mass in the bladder.───以超音波來(lái)探查輸尿管囊腫,相當(dāng)簡(jiǎn)易,其膀胱內(nèi)呈現(xiàn)囊腫腫塊。
67 、Her family history was unremarkable in terms of consanguinity and following ultrasound findings were discovered.───其沒(méi)有明顯的近親婚育的家族病史。
68 、The ultrasound where we find out is tomorrow.─── 明天做超聲波檢查才能知道
69 、A Doppler ultrasound is part of the echocardiogram test.───也是超聲波心動(dòng)圖檢查的一個(gè)部分。
70 、Another technique is ultrasound, known by many for its pictures of babies in the womb.───另外一種技術(shù)是超聲波,因?yàn)槟芸闯鲎訉m內(nèi)胎兒的樣于而被許多人了解。
71 、In 149 of them, BUA (broadband ultrasound attenuation), T|score, Z|score and age were as the parameters.───其中 1 49例以寬波段超聲衰減 ( BUA)、T-score( T評(píng)分 )、Z-score( Z評(píng)分 )及年齡為變數(shù) ;
72 、We also show the usefulness and versatility of chest ultrasound when dealing with unfavorable patient conditions.───我們也顯示胸腔超音波檢查在病人情況不佳時(shí)的實(shí)用性與靈活性。
73 、"In our country ultrasound is becoming a weapon of mass destruction.───“在我們國(guó)家超聲波已經(jīng)成為大量破壞的武器。
74 、We did an ultrasound, and it is as we suspected.─── 我們做了超聲檢查 和我們預(yù)計(jì)的一樣
75 、In the past two years, we diagnosed 37 cases of gastric lesion by ultrasound.───在過(guò)去二年中,我們應(yīng)用超音波診斷37例胃部病灶的病例。
76 、Ultrasound (US), precontrast CT (PCT), and contrast CT(CCT) were pefored in all patients.───全部病例同時(shí)作了?,F(xiàn)二維超聲(US),平掃CT(PCT)和增強(qiáng)CT(CCT);
77 、Objective To investigate the diagnostic values of color ultrasound to the stenosis of extracranial carotid arteries.───摘要目的研究彩色多普勒超聲檢查對(duì)頸部動(dòng)脈狹窄的診斷價(jià)值。
78 、In this paper the dynamic ultrasound image of muscle and the derived dynamic signals, termed sonomyography (SMG).───我們把超聲掃描肌肉時(shí)得到的動(dòng)態(tài)超聲圖像以及從中得到的動(dòng)態(tài)信號(hào)稱(chēng)為“聲肌圖(sonomyography)”,簡(jiǎn)寫(xiě)成SMG。
79 、Objective: To explore the application of vaginal probe in diagnosing seminal vesicular disease by ultrasound.───摘要目的:探討**探頭在精囊疾病超聲診斷中的使用價(jià)值。
80 、Using color Doppler ultrasound (CDUS), we diagnosed three patients of AVF who had hematuria following PNB.───在兩個(gè)月間,我們藉由彩色都卜勒超音波,診斷出三例曾接受經(jīng)皮腎臟穿刺后,而出現(xiàn)血尿癥狀患者為動(dòng)靜脈瘺管。
81 、This method is used for infants less than one year of age when ultrasound equipment is not available.───在沒(méi)有超聲波儀器時(shí),用本法測(cè)量未滿(mǎn)周歲嬰兒的血壓。
82 、Kost, Joseph L, Robert S. Ultrasound enhancement of membrane permeability: US, 4780212[P]. 1988-10-25.───王曉麗,高博,傅學(xué)起.超聲波處理對(duì)微濾膜損傷的影響[J].膜科學(xué)與技術(shù),2005,25(6):7-11.
83 、Should all midwives learn to perform ultrasound?───助產(chǎn)士都應(yīng)該學(xué)習(xí)做超聲嗎?
84 、Speckle is an inherent noise in ultrasound images.───斑點(diǎn)噪聲是超聲圖像中固有的噪聲。
85 、After the doctors find the stone, the ultrasound probe is placed directly against it.───醫(yī)生找到腎結(jié)石后,就將超聲波探測(cè)器移到正對(duì)著腎結(jié)石的部位。
86 、In two patients, postresection ultrasound prompted additional nidus remoal.───在兩例患者中,切除后超聲提示有附帶病灶要切除。
87 、The new technology is smaller and cheaper than regular ultrasound machines.───新儀器比傳統(tǒng)的超聲波儀更小巧而且更便宜。
88 、All patients examined using Apachi RX 400 color Doppler ultrasound diagnosis instrument produced in USA.───由美國(guó)阿帕奇rx 4 0 0型彩色多普勒超聲診斷儀檢測(cè)。
89 、The authors note that NAFLD was the most common cause (81.5%) of hepatic steatosis on ultrasound.───作者認(rèn)為NAFLD是超聲掃描下肝臟脂肪變性最常見(jiàn)的致病因素(81.5%)。
90 、Among 12 cases of isolated node type,ultrasound diagnostic accordance rate is 50%.───1孤立結(jié)節(jié)型 12例 ,超聲診斷正確率 5 0% ;
pat文件怎么打開(kāi)?
用Acrobat這個(gè)軟件可以打開(kāi)。PAT文件可以是ACAD的定義填充圖案文件.也可以是moto手機(jī)的權(quán)限文件。需上傳到手機(jī)才能訪(fǎng)問(wèn)相應(yīng)的java文件,甚至可以是支持亮片功能的繡花機(jī)花版數(shù)據(jù)格式。常用的是:
1、DataCADHatch模式文件;
2、CorelDRAW模式;
3、高級(jí)GravisUltrasound/Forte技術(shù);
4、碎片文件。
如何成為?Kaggle頂級(jí)大師?
Vladimir I. Iglovikov 是一名 Kaggle 頂級(jí)大師(Grandmaster),曾獲得過(guò) Carvana 圖像遮蔽挑戰(zhàn)的冠軍,以及 Dstl 衛(wèi)星圖像特征檢測(cè)挑戰(zhàn)的第三名。他曾在 UC Davis 獲得過(guò)理論凝聚態(tài)物理學(xué)博士的學(xué)位,現(xiàn)在是一名 Lyft 的計(jì)算機(jī)視覺(jué)工程師,主要研究自動(dòng)駕駛。
最近,Vladimir 分享了自己成為 Kaggle 高手的經(jīng)驗(yàn)。目前,Kaggle 注冊(cè)用戶(hù)數(shù)量已超 100 萬(wàn),其中只有 124 人擁有 Grandmaster 頭銜,如何成為全球排名前千分之一的數(shù)據(jù)科學(xué)家?讓我們看看他是怎么說(shuō)的。
我叫 Vladimir,本科畢業(yè)并獲得理論物理學(xué)位后搬到了硅谷,從事數(shù)據(jù)科學(xué)相關(guān)的工作。我當(dāng)前在 Lyft 公司的自動(dòng)駕駛部門(mén)工作,研究與計(jì)算機(jī)視覺(jué)相關(guān)的應(yīng)用。
過(guò)去幾年來(lái),我花了很多時(shí)間參加關(guān)于機(jī)器學(xué)習(xí)的比賽。這樣做是因?yàn)椋环矫嫖矣X(jué)得它本身很好玩,而另一方面,我覺(jué)得這是一種非常高效的數(shù)據(jù)科學(xué)技能提升方法。當(dāng)然,不是所有的比賽都很容易,我也不是在每場(chǎng)比賽中都能獲得好成績(jī)。但時(shí)不時(shí)地參加這些比賽,讓我不斷地提高了自己的相關(guān)技能,甚至最終獲得了 Kaggle Grandmaster 的稱(chēng)號(hào)。
我要向 @Lasteg 表示感謝,是他提議我參加這期的 AMA(Ask Me Anything session)并在 Reddit、kaggle、science.d3.ru(in Russian)上收集問(wèn)題。他收集有很多問(wèn)題,我會(huì)盡我所能去回答,但沒(méi)辦法在本篇博客中解決所有問(wèn)題。如果你的疑問(wèn)未能在本文獲得解答,可以在評(píng)論中留言。
以下是我(或我的團(tuán)隊(duì))有幸躋身排行榜前列的一些深度學(xué)習(xí)挑戰(zhàn):
在 Ultrasound Nerve Segmentation 中獲得第十名
在 Dstl Satellite Imagery Feature Detection 中獲得第三名
在 Safe passage: Detecting and classifying vehicles in aerial imagery 中獲得第二名
在 Kaggle: Planet: Understanding the Amazon from Space 中獲得第七名
在 MICCAI 2017: Gastrointestinal Image ANAlysis (GIANA) 中獲得第一名
在 MICCAI 2017: Robotic Instrument Segmentation 中獲得第一名
在 Kaggle: Carvana Image Masking Challenge 中獲得第一名
在 Kaggle: IEEE's Signal Processing Society—Camera Model Identification 中獲得第九名
在 CVPR 2018 Deepglobe. Road Extraction. 中獲得第二名
在 CVPR 2018 Deepglobe. Building Detection. 中獲得第二名
在 CVPR 2018 Deepglobe. Land Cover Classification. 中獲得第三名
在 MICCAI 2018: Gastrointestinal Image ANAlysis (GIANA) 中獲得第三名
Q:除了數(shù)據(jù)科學(xué)以外,您生活中喜歡做些什么?
A:當(dāng)然,我喜歡徒步旅行、攀巖。如果你早上去 Mission Cliffs 攀巖館,見(jiàn)到我可以打個(gè)招呼。
我也喜歡跳舞,特別是 Bules Fusion。舊金山的 Misiion Fusion 和 South Bay Fusion 舞蹈產(chǎn)地是我經(jīng)常去的。
旅行對(duì)我來(lái)說(shuō)很重要。春天的時(shí)候我去了白俄羅斯、摩洛哥、約旦。九月,我在芬蘭、德國(guó)、奧地利呆了三周。當(dāng)然,2018 Burning Man 是今年最爽的活動(dòng)。
Q:你如何在工作的同時(shí)花很多時(shí)間做 kaggle 呢?
A:對(duì)我來(lái)說(shuō),雖然沒(méi)有薪酬,但參加 Kaggle 比賽是我的第二職業(yè)。我這么做理由很充足?;钴S的 Kaggle 參與者追求領(lǐng)域的改變很常見(jiàn)。我也不例外。當(dāng)我從學(xué)界轉(zhuǎn)向業(yè)界時(shí),我開(kāi)始參加比賽。我需要一個(gè)高效的方法來(lái)盡快熟悉 ML 需要解決的問(wèn)題,掌握那些工具,并將思維擴(kuò)展機(jī)器學(xué)習(xí)的新領(lǐng)域。
后來(lái),當(dāng)我在 Bidgely 開(kāi)始我的第一份工作之后,我參與的 Kaggle 賽事更多了。有段時(shí)間,我在研究信號(hào)處理任務(wù),同時(shí)幾乎將所有晚上的時(shí)間用來(lái)處理參加比賽用的表格數(shù)據(jù)。那段時(shí)間我的工作和生活有些失衡,但我獲得的知識(shí)卻是值得的。
再后來(lái),我做好準(zhǔn)備換工作以后,加入了 TrueAccord,在那里我做了很多傳統(tǒng)的機(jī)器學(xué)習(xí)任務(wù)。但我不想停止對(duì) Kaggle 的研究,所以我白天做的是傳統(tǒng)機(jī)器學(xué)習(xí),晚上和周末研究深度學(xué)習(xí)。也因此,工作和生活更加無(wú)法保持平衡。但我學(xué)到了很多東西,獲得了很好的附加技能,成為了 Kaggle Master。當(dāng)我加入 Lyft Level 5 時(shí),我知道所有這些努力都沒(méi)有白費(fèi),在這份工作里我將深度學(xué)習(xí)應(yīng)用于自動(dòng)駕駛問(wèn)題上。
最終,我沒(méi)有全職做 Kaggle,但我仍在積極地學(xué)習(xí)。工作中有很多有趣的計(jì)算機(jī)視覺(jué)問(wèn)題,我正嘗試在 Kaggle 沒(méi)有涉足的領(lǐng)域里獲得更多的知識(shí)。我仍然時(shí)不時(shí)地向各種比賽提交參賽作品,但這主要是為了更好地理解其他參賽者正面臨的問(wèn)題和挑戰(zhàn),這樣做反過(guò)來(lái)有助于我從論壇分享的信息中獲得很大的收益。
Q:幫助你提高工作效率的日常慣例是什么?你如何安排一天的行程?
A:首先,我不太確定自己是否高效,因?yàn)槲铱偸窃趯ふ倚碌霓k法優(yōu)化工作方式。
需要解決的問(wèn)題和需要參與的活動(dòng)總是很多,但不是所有的都有用又好玩。所以我做什么事情都要優(yōu)先考慮。有兩本書(shū)對(duì)這個(gè)話(huà)題進(jìn)行了精彩的討論:《So Good They Can't Ignore You: Why Skills Trump Passion in the Quest for Work You Love》和《Deep Work: Rules for Focused Success in a Distracted World》。
工作日,我一般早上 6 點(diǎn)起床,然后去攀巖館。這樣做能幫助我保持身材并讓我一天都保持清醒。之后,我開(kāi)車(chē)去上班。我們的自動(dòng)駕駛工程中心位于 Palo Alto,這對(duì)我來(lái)說(shuō)有點(diǎn)憂(yōu)桑,因?yàn)槲腋矚g住在市區(qū)。開(kāi)車(chē)很有趣,但通勤很煩。為了讓通勤時(shí)間更有效率,我會(huì)在車(chē)?yán)锫?tīng)有聲讀物。開(kāi)車(chē)時(shí)當(dāng)然沒(méi)法專(zhuān)心聽(tīng)書(shū),但在駕駛時(shí)聽(tīng)聽(tīng)這些文學(xué)、有關(guān)軟技能和商業(yè)的書(shū)總是不錯(cuò)的。
我想好好把握工作和生活之間的平衡,但沒(méi)有做到。當(dāng)然,我花了很多時(shí)間和朋友參加不同的活動(dòng),而且很多活動(dòng)是在舊金山。同時(shí),我仍需要學(xué)習(xí);我還要保持機(jī)器學(xué)習(xí)的狀態(tài),不能把目光局限在工作中遇到的問(wèn)題上。所以我晚上有時(shí)候會(huì)閱讀技術(shù)文獻(xiàn),或者為比賽、輔助項(xiàng)目和開(kāi)源項(xiàng)目編寫(xiě)代碼。
談到開(kāi)源項(xiàng)目,我想借此機(jī)會(huì)**一個(gè)圖像增強(qiáng)庫(kù),該庫(kù)是由我和 Alexander Buslaev、Alex Parinov、Eugene Khvedchenia 一起基于我們有關(guān)視覺(jué)挑戰(zhàn)賽的研究創(chuàng)建的。
如果不闡述細(xì)節(jié)的話(huà),可能沒(méi)法說(shuō)清楚這個(gè)問(wèn)題:
我更喜歡 Ubuntu+i3 的電腦,而不是 MacBook,因?yàn)檫@樣能讓我的效率提升 10%。
我很少用 Jupyter notebook,僅用于 EDA 和可視化。幾乎所有的代碼我都是在 PyCharm 上寫(xiě)的,然后用 flake8 檢查,再傳到 GitHub 上。很多 ML 問(wèn)題都非常相似。找一個(gè)更好的代碼庫(kù),而不是重復(fù)自己的代碼,然后思考如何最好地重構(gòu)。這樣做雖然在開(kāi)始時(shí)進(jìn)展緩慢,但后面會(huì)加快你的進(jìn)步。
我正在嘗試編寫(xiě)單元測(cè)試。所有人都在討論單元測(cè)試在數(shù)據(jù)科學(xué)中的重要性,但很少有人花時(shí)間去寫(xiě)。Alex Parinov 寫(xiě)了一個(gè)很好的文檔(https://albumentations.readthedocs.io/en/latest/writing_tests.html),教你怎么從簡(jiǎn)單的測(cè)試做到復(fù)雜的測(cè)試。你可以嘗試一下,然后再你的學(xué)術(shù)或 Kaggle ML 流程中添加更多測(cè)試。
目前,我正在試用模型版本化工具 DVC,我希望它能增加我的 ML 流程的復(fù)現(xiàn)率和代碼的可重用率。
我很少用鼠標(biāo)。因此我有時(shí)候需要在頁(yè)面上寫(xiě)熱鍵,然后盡可能多地使用它們。
我不使用社交網(wǎng)絡(luò)。
我一天僅查收幾次郵件。
我甚至?xí)谠缟狭幸粋€(gè)當(dāng)日任務(wù)清單,然后解決它們。我使用 Trello 來(lái)做這個(gè)。
我不會(huì)把一天的時(shí)間分割得很亂。很多任務(wù)需要集中精力,而總是切換焦點(diǎn)沒(méi)什么用。
以上大概就我的一些工作標(biāo)準(zhǔn)了。
Q:你如何跟上這個(gè)領(lǐng)域的最新研究?
A:「跟上」這個(gè)詞對(duì)我也不太準(zhǔn)確,機(jī)器學(xué)習(xí)領(lǐng)域近來(lái)很活躍,有關(guān)的論文數(shù)量、比賽、博客和書(shū)籍非常多,不可能全部瀏覽。實(shí)際上,當(dāng)我遇到一些問(wèn)題時(shí),我會(huì)把注意力放在最新的研究上,并深入挖掘。解決完這個(gè)問(wèn)題后,我再轉(zhuǎn)向另一個(gè)問(wèn)題。因此,我只對(duì)那些我親身經(jīng)歷過(guò)的領(lǐng)域了解較深。同時(shí),我對(duì)研究過(guò)的問(wèn)題都有較深的專(zhuān)業(yè)知識(shí),這個(gè)問(wèn)題清單很長(zhǎng),而且還在持續(xù)增加。這個(gè)事實(shí)也讓我確信,將自己編寫(xiě)并保存在私人存儲(chǔ)庫(kù)中的經(jīng)驗(yàn)和代碼將有助于我快速開(kāi)始任何新的 ML 相關(guān)任務(wù)。
此外,這還意味著我對(duì)很多問(wèn)題的處理方式都有大概的了解,這樣我下次面對(duì)類(lèi)似的問(wèn)題時(shí)心里也有譜。
我還參加過(guò)像 NIPS、CVPR 這樣的人工智能會(huì)議,在這些大會(huì)上展示的研究成果能夠很好地代表我們當(dāng)前的研究水平。
Q:四五年前,在非機(jī)器學(xué)習(xí)領(lǐng)域拿到一個(gè)博士學(xué)位(如物理學(xué))對(duì)雇主是有利的。但現(xiàn)在的情況好像變了,非機(jī)器學(xué)習(xí)領(lǐng)域的博士學(xué)位和機(jī)器學(xué)習(xí)的碩士學(xué)位相比,IT/ML 行業(yè)更愿意選后者擔(dān)任機(jī)器學(xué)習(xí)工程師/開(kāi)發(fā)者職位,至于研究崗我不太清楚。您獲得了物理學(xué)博士學(xué)位,然后轉(zhuǎn)到機(jī)器學(xué)習(xí)領(lǐng)域,我認(rèn)為您的經(jīng)歷可能適合回答這個(gè)問(wèn)題。
如果獲得非機(jī)器學(xué)習(xí)博士想轉(zhuǎn)到機(jī)器學(xué)習(xí)行業(yè),您對(duì)此有何看法?這有助于獲取企業(yè)內(nèi)的研究職位嗎?與機(jī)器學(xué)習(xí)相關(guān)碩士相比有優(yōu)勢(shì)嗎?
A:這個(gè)問(wèn)題比較困難,我不知道答案。
物理學(xué)是一門(mén)偉大的學(xué)科。即使回到過(guò)去,可以在物理學(xué)和計(jì)算機(jī)科學(xué)之間進(jìn)行選擇,即使知道我最終會(huì)轉(zhuǎn)到計(jì)算機(jī)科學(xué)領(lǐng)域,我仍然會(huì)選擇物理學(xué)。
當(dāng)然,主要原因是我對(duì)物理學(xué)和自然科學(xué)比較感興趣。機(jī)器學(xué)習(xí)能夠講授浩翰多彩宇宙的運(yùn)行原理嗎?不能,但是物理學(xué)可以。不止如此。我的轉(zhuǎn)型之路相對(duì)容易的原因之一是物理學(xué),這門(mén)學(xué)科給予我的不僅是量子力學(xué)、相對(duì)論等知識(shí),還有數(shù)學(xué)、統(tǒng)計(jì)學(xué)、編程技巧,這些技能有利于向其他領(lǐng)域的轉(zhuǎn)換。
物理學(xué)教會(huì)你如何在嚴(yán)謹(jǐn)理論和實(shí)驗(yàn)之間以結(jié)構(gòu)化的方式進(jìn)行轉(zhuǎn)換,這對(duì)機(jī)器學(xué)習(xí)從業(yè)者而言也是一項(xiàng)必備技能。另外,自學(xué)集合不可能學(xué)習(xí)物理學(xué)或高等數(shù)學(xué)。這點(diǎn)也是我的公司信條,即深度學(xué)習(xí)的下一個(gè)大突破將在我們明白如何將高等數(shù)學(xué)應(yīng)用到機(jī)器學(xué)習(xí)中的時(shí)候出現(xiàn)。現(xiàn)在具備大一水平的數(shù)學(xué)知識(shí)在計(jì)算機(jī)視覺(jué)領(lǐng)域已經(jīng)足夠了。
所有這些都意味著目前數(shù)學(xué)不是攔路虎,這也是掌握了數(shù)學(xué)/物理學(xué)/化學(xué)和其他 STEM 學(xué)科的額外知識(shí)對(duì)于解決大部分商業(yè)問(wèn)題幾乎無(wú)用的原因,也是這些學(xué)科的畢業(yè)生轉(zhuǎn)行的原因。他們擁有大量專(zhuān)門(mén)知識(shí),有博士學(xué)位,在學(xué)界待了很多年,但無(wú)法得到有趣且高薪的工作。網(wǎng)絡(luò)上到處是這種類(lèi)型的博客文章。
另一方面,能寫(xiě)代碼在各個(gè)地方都是必要的,這也是潛在雇主在了解數(shù)學(xué)的人和能寫(xiě)代碼的人中間幾乎總是選擇后者的原因。
但我認(rèn)為這種情況會(huì)改變的。不是現(xiàn)在,是未來(lái)的某個(gè)時(shí)間點(diǎn)。
你讀的論文、你上的課可能與你在行業(yè)中所需的技能并不直接相關(guān),注意到這一點(diǎn)很重要。這是對(duì)的,但無(wú)傷大雅。
通常,在業(yè)界作為數(shù)據(jù)科學(xué)家或軟件開(kāi)發(fā)者工作所需的技能可以通過(guò)自學(xué)學(xué)習(xí),不能在大學(xué)里學(xué)到。人們?cè)诠I(yè)界學(xué)到的大部分事情可以通過(guò)在某家公司的全職工作來(lái)獲取。
此外,找工作的同時(shí)還要寫(xiě)理論物理學(xué)論文、研究數(shù)據(jù)科學(xué),這對(duì)我來(lái)說(shuō)壓力太大了。
當(dāng)時(shí),我并未掌握所有必備知識(shí),我也不理解硅谷的運(yùn)作和他們對(duì)我的期望。我基本上是一張白紙,我做的唯一一件事是不斷地把簡(jiǎn)歷投給不同的公司,不斷地面試,從每次失敗中學(xué)習(xí),然后再繼續(xù),直到面試成功。
我記得有一次面試官問(wèn)我畢業(yè)論文主題是什么,我當(dāng)時(shí)在研究量子蒙特卡羅(Quantum Monte Carlo),我如實(shí)回答了這個(gè)問(wèn)題,然后盡力解釋它的意思以及我們?yōu)槭裁葱枰C嬖嚬倏粗?,?wèn)了一句話(huà):「這項(xiàng)技術(shù)如何幫助我們提高客戶(hù)參與度?」
我想說(shuō)對(duì)于非計(jì)算機(jī)科學(xué)專(zhuān)業(yè)的人來(lái)說(shuō),最好的方法是參加計(jì)算機(jī)科學(xué)系內(nèi)部的數(shù)據(jù)科學(xué)(DS)相關(guān)課程。業(yè)余時(shí)間學(xué)習(xí) DS / ML。幸運(yùn)的是,有很多資源。在自己院系中找到一個(gè)想使用機(jī)器學(xué)習(xí)解決自己?jiǎn)栴}的教授也是個(gè)好主意。申請(qǐng)技術(shù)公司的 ML 相關(guān)實(shí)習(xí)崗位,拿到實(shí)習(xí)崗位比獲得全職工作容易一些。
實(shí)習(xí)后轉(zhuǎn)為正式崗就很直接了。比如我的朋友胡文健,他和我同一個(gè)研究小組研究物理學(xué),他先在 Facebook 實(shí)習(xí),后來(lái)得到了 Facebook AI Research 的研究科學(xué)家職位。
不要高估專(zhuān)業(yè)、大學(xué)對(duì)找工作的影響。企業(yè)雇傭你時(shí),主要是付錢(qián)讓你解決他們面臨的問(wèn)題。你的學(xué)位和專(zhuān)業(yè)只是他們用來(lái)估計(jì)你能力的東西。如果你的簡(jiǎn)歷中沒(méi)有他們想看到的內(nèi)容,那很難通過(guò) HR 的簡(jiǎn)歷篩選,對(duì)找工作很重要的人際關(guān)系網(wǎng)也會(huì)減弱,但這仍然不應(yīng)該影響你決定自己學(xué)什么專(zhuān)業(yè)。
我的想法可能有點(diǎn)天真,但我覺(jué)得人們選擇自己專(zhuān)業(yè)的標(biāo)準(zhǔn),不應(yīng)該是高薪,而是熱情(passion)。
Q:你覺(jué)得數(shù)據(jù)科學(xué)/ML 中有趣的問(wèn)題是什么?我的碩士學(xué)位完成了一半,但我不知道以后要從事 ML 哪方面的工作。我和認(rèn)為 Algo 創(chuàng)建與擴(kuò)展是最好領(lǐng)域的人交談過(guò)(對(duì)于 DS / ML 應(yīng)用程序而言,更可能是庫(kù)**件和 chug)。對(duì)此你有什么看法?或者關(guān)于職業(yè)靈活性的建議?
A:我認(rèn)為 DS/ML 中有趣的問(wèn)題與當(dāng)今主流相去甚遠(yuǎn)。研究主流問(wèn)題的人太多。將 ML 應(yīng)用于信用評(píng)分、推薦系統(tǒng)和零售等我都覺(jué)得很無(wú)聊。如果你用 DS/ML 來(lái)解決那些數(shù)學(xué)、物理、生物、化學(xué)、歷史、考古、地理問(wèn)題或者那些人們很少應(yīng)用 ML 的問(wèn)題,你可能會(huì)找到下一個(gè)屬于你的 Purple Cow。
至于職業(yè)選擇,與生物或物理不同,你在 DS/ML 中學(xué)到的技能很容易從一個(gè)領(lǐng)域轉(zhuǎn)到另一個(gè)領(lǐng)域。當(dāng)然,開(kāi)發(fā)銀行或?qū)_基金交易的算法和開(kāi)發(fā)自動(dòng)駕駛汽車(chē)不是一回事,但差別也沒(méi)有那么大。只要你基礎(chǔ)牢固,很快就能掌握必要的技能。
Q:30 歲(有學(xué)習(xí)背景,但不是 Math/CS 方面)加入 ML 社區(qū)是否為時(shí)已晚?是否有可能趕上末班車(chē)?如果可以,你覺(jué)得最低要求是什么?
A:當(dāng)然不晚。90% 的 ML 只需要技術(shù)大學(xué)大一的數(shù)學(xué)知識(shí),不需要超深的數(shù)學(xué)知識(shí)。DS 中使用最廣泛的語(yǔ)言是 Python 和 R 語(yǔ)言,這兩種語(yǔ)言比較高級(jí),因此你可以從它們?nèi)胧?,而不是在技術(shù)細(xì)節(jié)方面死磕。
我建議參加一些 DS 的在線(xiàn)課程,然后研究一些 Kaggle 問(wèn)題。當(dāng)然,很多概念聽(tīng)起來(lái)都很新,但你只要保持自律和專(zhuān)注,慢慢就會(huì)懂了。
這兒有兩個(gè)關(guān)于年齡的例子:
Kaggle Grandmaster Evgeny Patekha 40 歲才開(kāi)始數(shù)據(jù)科學(xué)研究。
Kaggle Grandmaster Alexander Larko 55 歲才開(kāi)始參加 Kaggle。
Q:你認(rèn)為技術(shù)領(lǐng)域的正規(guī)基礎(chǔ)教育對(duì)獲得數(shù)據(jù)科學(xué)和 Kaggle 比賽的成功是必要的嗎?在你的工作經(jīng)歷中有沒(méi)有遇到相反的例子?
A:我只能說(shuō)這些很有用,但并非必要。很多在 Kaggle 中獲得成功的人并沒(méi)有技術(shù)領(lǐng)域的基礎(chǔ)教育背景。典型的例子就是 Mikel Bober-Irizar,他是一名 Kaggle Grandmaster,但還在念高中……
不過(guò)你要記住的另一件事是:你在 Kaggle 中學(xué)到的技能只是你將來(lái)在 ML 業(yè)界或?qū)W界所需技能的一小部分。而那些在 Kaggle 中無(wú)法學(xué)到的技能,基礎(chǔ)教育可以為你提供。
不過(guò)話(huà)說(shuō)回來(lái),就算沒(méi)有高中學(xué)歷你也能擅長(zhǎng) Kaggle。
Q:你用了多長(zhǎng)時(shí)間學(xué)習(xí)數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí),才成為了 Kaggle 高手?
A:我是在 2015 年 1 月決定轉(zhuǎn)向數(shù)據(jù)科學(xué)的。在這之后,我開(kāi)始在 Coursera 上學(xué)習(xí)線(xiàn)上課程。在當(dāng)年 2 月底,我知道了 Kaggle 的存在并注冊(cè)了自己的賬號(hào),兩個(gè)月之后我獲得了自己的第一個(gè)銀牌。
Q:使用家用臺(tái)式機(jī)不用云服務(wù)在 Kaggle 比賽里能得高分嗎?
A:我不在比賽中使用云服務(wù),但我家里有兩臺(tái)比較強(qiáng)力的計(jì)算機(jī):一臺(tái)有 4 塊 GPU,另一臺(tái)有兩塊。你可以在沒(méi)有強(qiáng)大深度學(xué)習(xí)機(jī)器的情況下獲得 Kaggle 比賽的好成績(jī),但是缺乏算力的限制會(huì)使你在單位時(shí)間內(nèi)嘗試思路的數(shù)量——而思路的數(shù)量和最終的結(jié)果密切相關(guān)。所以如果你以 24/7 的投入訓(xùn)練模型,你就需要投資購(gòu)買(mǎi)一臺(tái)好機(jī)器。
在幾代更新之后,我的開(kāi)發(fā)硬件最終變成了這樣:一臺(tái) 4GPU 的機(jī)器用于高負(fù)載,另一臺(tái)雙卡的機(jī)器用于原型設(shè)計(jì)。
僅有一臺(tái)強(qiáng)大的計(jì)算機(jī)還是不夠的,你需要學(xué)一些編程技巧,來(lái)利用它的算力。
我從 Keras 轉(zhuǎn)到 PyTorch 的一個(gè)原因是當(dāng)時(shí)后者的 DataLoader 更加強(qiáng)大。
我們看到 imgaug 太慢了,于是寫(xiě)了 albumentations,以利用 100% 的 CPU 算力,不過(guò)它沒(méi)法充分利用 GPU。
如果想加速硬盤(pán)上 jpeg 圖像的吞吐速度,我們不應(yīng)該使用 PIL、skimageand 甚至 OpenCV,而是應(yīng)該用 libjpeg-turbo 或 PyVips。
其他
Q:對(duì)于從 Kaggle 競(jìng)賽開(kāi)始數(shù)據(jù)科學(xué)家生涯的人,你對(duì)他們有什么建議嗎?特別是那些首次參加競(jìng)賽的菜鳥(niǎo),有什么最好的建議?
A:有很多方式來(lái)參加 Kaggle 競(jìng)賽,但根據(jù)我的觀察經(jīng)驗(yàn),獲取所需知識(shí)的最高效方法是使用黑客的方法。
觀看一些包含 Python 編程基礎(chǔ)和機(jī)器學(xué)習(xí)的在線(xiàn)課程。
參加一個(gè) Kaggle 競(jìng)賽。如果你可以寫(xiě)出一個(gè)從數(shù)據(jù)到提交的端到端流程,這很好。如果你是新手,這可能很難。在這種情況下,可以去論壇復(fù)制粘貼別人共享的 kernel。
在你的計(jì)算機(jī)上運(yùn)行,生成一個(gè)提交,在排行榜上獲取名次。在這一階段,操作系統(tǒng)、驅(qū)動(dòng)程序、庫(kù)版本、I/O 等問(wèn)題可能會(huì)讓你覺(jué)得很痛苦。你要盡快習(xí)慣。如果你不能理解 kernel 里寫(xiě)的什么,沒(méi)關(guān)系,問(wèn)題不大。
調(diào)整一些參數(shù),隨便調(diào)也沒(méi)關(guān)系,重新訓(xùn)練你的模型,提交預(yù)測(cè)。希望某些修改可以讓你的排名提升。不要擔(dān)心,很多人都是這么做的。他們都在做不同的調(diào)整,你不需要對(duì)相關(guān)知識(shí)或原理有深刻或直觀的理解。
為了超越周?chē)恼{(diào)參俠,你要發(fā)展出一種直覺(jué),并獲取關(guān)于什么方案可行、什么方案不可行的基礎(chǔ)知識(shí),從而可以更加智能和高效地探索可能方法的相空間。在這一步,你需要將學(xué)習(xí)作為實(shí)驗(yàn)的一部分。從兩個(gè)方向?qū)W習(xí),首先是像 mlcourse.ai、CS231n、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、如何寫(xiě)更好的代碼等基礎(chǔ)。一般來(lái)說(shuō),自主學(xué)習(xí)很難,但從長(zhǎng)期來(lái)看,這很重要。其次你會(huì)在相關(guān)問(wèn)題的論壇上看到很多新術(shù)語(yǔ)。記得注意這些術(shù)語(yǔ)。嘗試激勵(lì)自己在排行榜中取得更好成績(jī)作為外部動(dòng)力來(lái)學(xué)習(xí)新事物。但不要在學(xué)習(xí)和實(shí)驗(yàn)之間進(jìn)行選擇,同時(shí)做兩件事。機(jī)器學(xué)習(xí)是一門(mén)應(yīng)用科學(xué)。
在競(jìng)賽結(jié)束之后,雖然付出了很大的努力,但你也很可能在排行榜上取得很低的名次。這不奇怪。好好閱讀論壇的內(nèi)容,看看 winner 分享的解決方案,嘗試找出比之前更好的解決方案。下一次當(dāng)你看到相似的問(wèn)題時(shí),你的起點(diǎn)會(huì)高得多。
在多個(gè)競(jìng)賽中重復(fù)該過(guò)程,然后到達(dá) top。更重要的是,你將對(duì)很多問(wèn)題擁有好的解決方案,并且對(duì)于如何處理在競(jìng)賽中遇到的機(jī)器學(xué)習(xí)挑戰(zhàn)能夠發(fā)展良好的直覺(jué)。
Q:作為物理學(xué)背景的人,當(dāng)競(jìng)賽更多的是過(guò)擬合 vs 具體任務(wù)上的實(shí)際泛化效果時(shí),你會(huì)覺(jué)得挫敗嗎?如果會(huì),那你會(huì)怎么處理?
A:通常,你需要過(guò)擬合數(shù)據(jù)和指標(biāo),以獲取好的結(jié)果。這沒(méi)什么問(wèn)題。人們?cè)?ImageNet 數(shù)據(jù)集上過(guò)擬合了很多年,訓(xùn)練過(guò)程中仍然會(huì)出現(xiàn)很多新知識(shí)。但是你需要理解指標(biāo)和數(shù)據(jù)的細(xì)微之處,這是知識(shí)的來(lái)源。只要競(jìng)賽過(guò)程中能夠得到新知識(shí),那過(guò)擬合不會(huì)讓我覺(jué)得很挫敗。你可能注意到了,當(dāng)你擅長(zhǎng)一個(gè)問(wèn)題的流程和想法時(shí),這些可以作為你下一個(gè)問(wèn)題的可靠基線(xiàn)模型,這表明了一定的泛化性。
Q:你對(duì) Kaggle 的數(shù)據(jù)泄露(如 Santander、Airship prediction 和 Google Analytics)有什么看法?在 Kaggle 比賽中使用泄露的數(shù)據(jù)是否合乎道德?
A:我承認(rèn)組織比賽很難,所以當(dāng)發(fā)現(xiàn)數(shù)據(jù)泄露時(shí),我不會(huì)指責(zé)組織者。而人們利用泄露的數(shù)據(jù)參加比賽,我也覺(jué)得 OK。我承認(rèn)數(shù)據(jù)泄露阻礙了我參與一次挑戰(zhàn),但這主要是因?yàn)槲覠o(wú)法輕易地把獲得的知識(shí)擴(kuò)展到其它挑戰(zhàn)。我仍然認(rèn)為 Kaggle 管理員需要?jiǎng)?chuàng)建一份可能會(huì)泄露的數(shù)據(jù)清單,并在比賽前檢查數(shù)據(jù)以防止同樣的事件一次又一次發(fā)生。我相信他們正在為此努力。
Q:Kaggle 比賽對(duì)做一名 DL 工程師有多大用處?
A:這很難說(shuō)。Kaggle 在一些重要但非常狹窄的領(lǐng)域提升你的技能。這是一個(gè)非常重要的技能組合,對(duì)某些職位可能非常有用,但對(duì)另一些來(lái)說(shuō)則幫助不大。而對(duì)我從事過(guò)的工作,尤其是現(xiàn)在從事的自動(dòng)駕駛來(lái)說(shuō),Kaggle 技能是我從學(xué)界和其它知識(shí)來(lái)源中獲取的有力加分項(xiàng)。
不過(guò),要掌握 Kaggle 技能,光有扎實(shí)的基礎(chǔ)并不夠。很多東西你只能從業(yè)界學(xué)習(xí)。
雖然成為 Kaggle Master 對(duì)你的工作來(lái)說(shuō)不是必需的,也并不代表你會(huì)在工作中做得很好。但我相信,如果你是 Kaggle Master,你的簡(jiǎn)歷會(huì)更容易通過(guò) HR 的篩選,然后有機(jī)會(huì)進(jìn)入技術(shù)展示階段。
Q:成為 Kaggle Grandmaster 之后繼續(xù)參加比賽還有什么用處?已經(jīng)成為數(shù)據(jù)科學(xué)家之后繼續(xù)前進(jìn)的動(dòng)力是什么?
A:正如我前面所說(shuō)的,我現(xiàn)在不再參加 Kaggle 比賽了,但我開(kāi)始關(guān)注很多會(huì)議上出現(xiàn)的挑戰(zhàn)賽。我的團(tuán)隊(duì)在 MICCAI 2017、CVPR 2018 和 MICCAI 2018 取得了不錯(cuò)的成績(jī)。競(jìng)賽通常包括漂亮、干凈的數(shù)據(jù)集,這些數(shù)據(jù)需要的清理工作最少,可以讓你少關(guān)注數(shù)據(jù),多關(guān)注數(shù)值技術(shù)。這是你在工作中通常沒(méi)有的奢侈品,數(shù)據(jù)選擇過(guò)程通常是創(chuàng)建實(shí)用流程的最重要的組成部分。
Q:你對(duì)于本科生和研究生的學(xué)習(xí)和競(jìng)爭(zhēng)力有什么看法?什么水平才能真正掌握數(shù)據(jù)科學(xué)?
A:我甚至不知道是什么決定了數(shù)據(jù)科學(xué)。這個(gè)問(wèn)題有很多回答的方式,但在這里我們的主題是 Kaggle Grandmaster,所以讓我們把第一個(gè)里程碑設(shè)置為「Kaggle Master」。這是相對(duì)直接的標(biāo)準(zhǔn),一旦你開(kāi)始朝著這個(gè)方面努力,你就會(huì)對(duì)這一領(lǐng)域有更多的了解。
Q:如果沒(méi)有數(shù)學(xué)/計(jì)算機(jī)科學(xué)或其他一些高級(jí)計(jì)算課程教育背景,你在 Kaggle(或者更廣泛地說(shuō)是數(shù)據(jù)科學(xué)領(lǐng)域)上可以走多遠(yuǎn)?激情和求知欲能帶你走多遠(yuǎn)?
如果以目標(biāo)為導(dǎo)向并且愿意學(xué)習(xí),你可以在 Kaggle 或其他任何數(shù)據(jù)科學(xué)領(lǐng)域獲得最高成績(jī)。最艱難的是邁出第一步。Just do it!最好的時(shí)間是此時(shí)此刻,因?yàn)槊魈欤ǔR馕吨啦弧?/p>
沒(méi)有人問(wèn)過(guò)我這個(gè)問(wèn)題:在一場(chǎng)特定的比賽中,你是如何找到幫助你提高成績(jī)的人的?我覺(jué)得這是一個(gè)目前在博客中還沒(méi)有看到過(guò)的重要話(huà)題。
最常見(jiàn)的方法:一些朋友、同事對(duì)這個(gè)比賽很有熱情,他們聊這個(gè)比賽,一起開(kāi)會(huì)、討論問(wèn)題并組隊(duì)。一些人想做些事情;但另外一些忙于其他活動(dòng)。這種團(tuán)隊(duì)可以往前走一段,但走不遠(yuǎn)。
對(duì)于我以及其他一些參賽者來(lái)說(shuō)更好的方式有以下幾種:
1. 寫(xiě)出你的流程或平臺(tái)上分享的重構(gòu)流程。
2. 這個(gè)流程應(yīng)該以適當(dāng)?shù)母袷綄⑤斎霐?shù)據(jù)映射到提交的文件中,并生成交叉驗(yàn)證分?jǐn)?shù)。
3. 驗(yàn)證交叉驗(yàn)證分?jǐn)?shù)的改進(jìn)與排行榜上的改進(jìn)相關(guān)。
4. 執(zhí)行探索性數(shù)據(jù)分析,仔細(xì)瀏覽論壇,閱讀論文、書(shū)籍和之前類(lèi)似競(jìng)賽的解決方案。獨(dú)立工作。
5. 在某個(gè)時(shí)間點(diǎn),比如競(jìng)賽截止前 2-4 周,你會(huì)陷入困境。什么想法都沒(méi)法改進(jìn)你的排名。你嘗試了一切,這時(shí)你需要新的想法來(lái)源。
6. 這時(shí)你可以看下排行榜,與排名接近的積極參賽者進(jìn)行溝通。
7. 首先,你的預(yù)測(cè)平均值會(huì)帶來(lái)微小卻重要的提升。其次,很可能你的方法有一點(diǎn)不同,分享試過(guò)或沒(méi)試過(guò)的想法是有益的。第三,由于競(jìng)賽最初是個(gè)人單獨(dú)參賽,因此所有參賽者都會(huì)看數(shù)據(jù)、寫(xiě)流程、將競(jìng)賽的重要性置于其他活動(dòng)之上,以及受實(shí)時(shí)排行榜帶來(lái)的游戲效應(yīng)的刺激。
但更重要的是,人們傾向于高估自己愿意花在競(jìng)賽上的時(shí)間,低估獲取穩(wěn)定端到端流程之前要面臨的問(wèn)題。用排行榜來(lái)創(chuàng)建團(tuán)隊(duì)可以作為過(guò)濾器,確保你的潛在隊(duì)友和你達(dá)成共識(shí)。
在一些競(jìng)賽中,領(lǐng)域知識(shí)對(duì)于性能結(jié)果非常重要。例如,表格數(shù)據(jù)(tabular data)和對(duì)應(yīng)的特征工程或醫(yī)學(xué)成像,你可以考慮和具備深厚領(lǐng)域知識(shí)的人組隊(duì),即使他/她沒(méi)有強(qiáng)大的數(shù)據(jù)科學(xué)背景,不過(guò)這種情況比較稀少。
另一方面,業(yè)界組建團(tuán)隊(duì)的方式完全不同。使用 Kaggle 的方式在業(yè)界組隊(duì)是不明智的。
在這里,我要感謝所有曾經(jīng)與我組隊(duì)的人,他們?cè)诒荣愔薪虝?huì)了我很多:
Artem Sanakoeu, Alexander Buslaev, Sergey Mushinskiy, Evgeny Nizhibitsky, Konstantin Lopuhin, Alexey Noskov, Artur Kuzin, Ruslan Baikulov, Pavel Nesterov, Arseny Kravchenko, Eugene Babakhin, Dmitry Pranchuk, Artur Fattakhov, Ilya Kibardin, Liam Damewood, Alexey Shvets, Anton Dobrenkii, Selim Seferbekov, Alexandr Kalinin, Alexander Rakhlin.
了