立場新聞 Stand News

到 EA 實習是怎樣的體驗?(3rd week)

2019/6/27 — 15:12

轉眼間到了第三週;隨着工作慢慢取得進展,我想回首探討一個很重要的問題:EA 爲我 — — 一個從學校跌出來的博士生 — — 提供了怎樣的入職培訓呢?在形同算法組的 Global Analytics & Insights (GAI) 工作的我,是怎樣融入團隊裡面的呢?

前文回顧:

  1. 總部舒適的辦公環境,與工作效率相輔相成
  2. 不加班的部門怎樣運作?

事前自己的準備

爲了求得 data science 工作,我花費不少錢讀完了一個培訓班,從 SQL、case study、推薦系統和深度學習都過了一遍。雖然學到了不少有趣的事情,但總體來說根底還是比較薄弱的,畢竟缺乏解決實戰端到端問題的經驗。

廣告

另一方面,博士科研上需要用到大量的 Python 甚至 C++ 代碼,所以編程方面我還可以。最重要的問題,依然是缺乏寫 production code 的經驗。

工作崗位上,得到前輩的扶持

關於我的實際工作內容,我還沒有想到一個既精彩、又不會泄漏機密的描述方法。但總言之,需要利用 SQL 從雲端數據庫抽取海量數據,然後轉換成適合我工作的格式。「海量」的意思是以 Gigabyte 起跳,經過取樣後才能由個人電腦處理。

廣告

Easily said then done. 首先,數據庫明目五花八門,而且可能有重覆的內容;瞭解架構、鎖定目標的過程已經花費了一些時間。接下來落手寫 SQL 請求 (query) 的時候,亦因爲對語法的不熟練摸索了很久。另外,提交請求後可能要等待幾分鐘甚至更久,才會得到回覆;同事間亦提到一個曾經耗時一個星期的請求。數據量、數據格式和伺服器架構所限,刷新了我對 Big Data 的認知。

更不用說,要熟習學術環境很少用到的 Outlook 和 Slack。在公司安排會議和吹水時間非常容易 — — 前提是,要學懂使用兩個功能稍爲繁複的軟件!

幸好,同事和直屬上司們都非常友善,後者更爲實習生準備了《入職指南》(.docx),介紹了一些操作細節。更重要的是,接觸到的前輩們都很樂意當面解答任何疑問:從直屬上司科學家、旁邊座位的兩位姐姐、到笑口常開的人「夫」前輩,所有人都讓我覺得(幾乎)沒有太笨而不值得問的問題。透過聆聽他們的工作經驗,我慢慢學會了抽取數據的最有效方法、以及部門業務的各方各面。

(另外,亦有在背後向保安投訴我帶摺疊單車進辦公室的人,但我的懷疑對象工作上跟我沒有交往。)

「有時候可靠的說明文件」

副標題聽起來像是哆啦 A 夢某件不太好用的法寶,而事實的確如此。EA 作爲一間稍有規模和歷史的公司,早已發動員工爲運算架構、數據庫以及衍生代碼作書面說明,供內部使用。想法很好,但要說明的東西實在太多太複雜、而且會隨着時間變化,所以說明文件只是「有時候可靠」。

例如,文件會介紹一個看起來很適合、但事實上已經被刪除的數據庫。這時候,我的心情就跟大雄的有點相似:

via GIPHY

另一方面,內部文件亦記錄了新近完成的 project 的構思、算法和調用的數據。新手如我讀過後,對機器學習系統的認識又更進一步了。從案例中學習是很有效的!

結語

總括來說,是沒有給實習生很有系統的培訓啦。但這不是問題:畢竟博士生面對新的研究課題時,也會自動自覺地找辦法適應相關的概念、詞彙和工具。這時候同事們的傾力協助就發揮作用了;博士生主動學習的大腦加上周圍聰明人提供的養分,是個好配搭, 3 個星期內熟習基本技術操作也是可行的。

而實習生學得好、學得快和有成就感,最後得益的是公司。我不知道企業文化是怎樣被從頭塑造的,但我真的很佩服部門現時的行事作風!

原文刊於作者 Medium

發表意見