問題
ビッグデータ分析の前段階として、非構造化データを構造化データに加工する処理を記述している事例はどれか。
選択肢
- 1関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し、利用者が扱いやすい表計算ソフトウェアデータに加工する。
- 2個人情報を含むビッグデータを更に利活用するために、特定の個人を識別することができないように匿名化加工する。
- 3住所データ項目の中にある、“ヶ”と“が”の混在や、丁番地の表記不統一を、標準化された表記へ統一するために加工する。
- 4ソーシャルメディアの口コミを機械学習によって単語ごとに分解し、要約を作り、分析可能なデータに加工し、関係データベースに保管する。
正解
4. ソーシャルメディアの口コミを機械学習によって単語ごとに分解し、要約を作り、分析可能なデータに加工し、関係データベースに保管する。
詳しい解説を見る解説を閉じる
解説
非構造化データとは、文章や音声・画像のように行と列の形式に整理されていないデータを指す。エは、決まった形式を持たないソーシャルメディアの口コミ(テキスト)を機械学習で分解・要約し、関係データベースに格納できる構造化データへ変換しており、非構造化データを構造化データに加工する典型例である。よってエが正解。ア・ウはもともと構造化された(表形式の)データの抽出・正規化、イは匿名化(個人情報保護)の処理であり、非構造化から構造化への変換には当たらない。(出典: 令和6年度 基本情報技術者試験 科目A 問15)
一問一答
科目A 180問+科目B 60問