a023: 問題3、非結構資料
標籤 :
通過比率 : 100% (2 人 / 2 人 ) (非即時)
評分方式:
Tolerant

最近更新 : 2018-09-13 21:20

內容 :

大數據分析是國內外非常熱門的領域,資料科學家們藉由資料收集、 整理、儲存、建模、分析到展示,從大量的真實資料中找出所有可能 的關聯性,藉此可以延伸運用到預測、決策分析、人工智慧、自動化 等各行各業及各種領域,探究人們過往所不瞭解的事情。

對於大數據資料分析平台中,其中有一個關鍵的部份,就是必須能夠 處理結構、非結構及半結構化的資料,簡單解釋一下結構、半結構、 非結構化資料,結構化的資料是指可以預先知道欄位長度的資料,如 一般會放進關連資料庫處理的內容;半結構化資料則比較像 key, value 的索引,每一筆資料的各個欄位長度、一筆資料總長度和筆數都不是 固定的;而非結構化資料則比較屬於「內容」資料,如:圖片、網頁等,當然,結構資料是同質性 的,越非結構資料的資料間相關性就越低,如:學生資料(結構資料)、ATM 交易紀錄(半結構化資 料)和整個網站資料(圖片、交易紀錄、程式),為了使資料能結構化以便更容易處理,則需要把一 些非結構化的資料轉為半結構化或是結構化的資料,或是把半結構化資料轉為結構化資料。

 

所以,我們需要一個程式能夠將非結構化資料在「整理」階段,做一些預先的處理。如:

 

name=David,age=20,city=Taipei NTU address=No 1, RoseFu Rd 4the Sec, Taipei, Taiwan, 10617

 

可以知道 Taipei 出現了 2 次

輸入說明

第一行有一個數字n,代表接下來有n行字串

第二到N行為欲查詢之字串

輸出說明

請輸出欲查詢之字串在n行字串出現的次數

範例輸入
1
name=David,age=20,city=Taipei NTU address=No 1, RoseFu Rd 4the Sec, Taipei, Taiwan, 10617
Taipei
David
Foobar
範例輸出
2
1
0
測資資訊:
記憶體限制: 64 MB
不公開 測資點#0 (100%): 1.0s , <1M
提示 :
標籤:
出處:
[編輯: han910625 (Satisfy) ]
編號 身分 題目 主題 人氣 發表日期
沒有發現任何「解題報告」