百度校招機器學習/數據挖掘工程師筆試題目

    時間:2020-11-07 11:03:18 筆試題目 我要投稿

    2015百度校招機器學習/數據挖掘工程師筆試題目

      筆試時間:2014-9-20

    2015百度校招機器學習/數據挖掘工程師筆試題目

      筆試職位:機器學習/數據挖掘工程師

      筆試城市:天津、深圳、南京等

      一. 簡答題

      1. new 和 malloc 的區(qū)別。

      2. hash沖突是指什么?怎么解決?給兩種方法,寫出過程和優(yōu)缺點。

      3. 命中的概率是 0.25,若要至少命中一次的概率不小于 0.75,則至少需要幾次?

      二. 算法設計題

      1. 用C/C++寫一個歸并排序。

      數據結構為struct Node{int v; Node *next};

      接口為 Node * merge_sort(Node *);

      2. 設計S型層次遍歷樹的算法,比如根節(jié)點是第一層,第二層從左至右遍歷,第三層從右至左遍歷,第四層再從左至右遍歷,以此類推。

      舉例:應依次輸出 1 2 3 6 5 4 7 8 9。

      3. 一個url文件,每行是一個url地址,可能有重復。

      (1)統(tǒng)計每個url的頻次,設計函數實現(xiàn)實現(xiàn)。

      (2)設有10億url,平均長度是20,現(xiàn)在機器有8G內存,怎么處理,寫出思路。

      三. 系統(tǒng)設計題

      自然語言處理中的中文分詞問題,前向最大匹配算法(FMM)。

      注:題目舉例說明了FMM的'基本思想。

      (1)設計字典的數據結構 structdictnote。

      (2)用C/C++實現(xiàn)FMM,可選接口為

      int FMM(vector iLetters, dictnode*iRoot, vector *oResults);

      其中 iLetters 為待分詞的句子,比如 {“小”,“明”,“今”,“天”,“買”,“了”,“i”,“p”,“o”,“n”,“e”,“6”},

      iRoot 是字典, oResults 保存輸出結果,即分詞的位置。也可以自己設計接口。

      (3)收集了一些手機品牌的字典,如{iphone,諾基亞}。

      現(xiàn)在要求查找包含這些手機品牌的網頁,比如包含 iphone6, 諾基亞 9973 等。

      怎么修改FMM實現(xiàn)這個功能,可以寫偽代碼。

    【2015百度校招機器學習/數據挖掘工程師筆試題目】相關文章:

    百度(數據挖掘工程師)筆試題目12-17

    2015百度校招產品經理筆試題目08-19

    2015年百度校招產品經理筆試題07-26

    騰訊校招筆試題目12-20

    網易2015校招筆試題09-09

    2015阿里校招研發(fā)工程師筆試題08-13

    百度校招產品經理筆試題12-21

    三星校招筆試題目09-05

    2015阿里校招運營專員筆試題08-21

    2015百度春招產品經理筆試題08-29

    91久久大香伊蕉在人线_国产综合色产在线观看_欧美亚洲人成网站在线观看_亚洲第一无码精品立川理惠

      亚洲一级AV在线大片 | 在线观看亚洲人成影视 | 在线观看亚洲精品福利片 | 亚洲一区二区视频在线观看 | 在线看片不卡人成视频 | 中文字幕欧美日本亚洲 |