英語のデータ分析 頻出単語|統計・グラフのボキャブラリー

英語

英語のデータ分析記事や会議で、知らない単語が出てくるたびに手が止まる。そんな悩みを持つ方へ。

データ分析の英語は、頻出する単語をテーマ別に押さえておくと、読むのも話すのも一気に楽になります。

この記事で分かることは次の3つです。

  • 統計・グラフ・傾向・データ操作など、分野別の必須ボキャブラリー
  • レポートや会議でそのまま使える、各単語の日本語訳と読み方
  • 似た意味で混同しやすい単語の、ニュアンスの違い

統計の基本用語

まずは、平均やばらつきを表す基礎的な統計用語です。

これらは数値レポートのいたるところに出てくる土台になります。

英語 読み方 日本語訳
average / mean アベレージ/ミーン 平均
median ミディアン 中央値
mode モード 最頻値
standard deviation スタンダード ディビエーション 標準偏差
variance バリアンス 分散
range レンジ 範囲(最大−最小)
sample size サンプル サイズ 標本数

“mean” と “average” はほぼ同義ですが、統計の文脈ではより厳密な “mean” が好まれます。

“standard deviation”(標準偏差)は、データが平均からどれだけ散らばっているかを示す指標です。

レポートで「平均は同じでも中身は違う」と説明したい場面で、この単語が役立ちます。

分布・ばらつきの用語

データの「散らばり方」や「偏り」を表す単語です。

平均だけでは見えない実態を語るときに役立ちます。

英語 読み方 日本語訳
distribution ディストリビューション 分布
skew スキュー 偏り(ゆがみ)
spread スプレッド ばらつき
outlier アウトライアー 外れ値
percentile パーセンタイル 百分位
quartile クォータイル 四分位
normal distribution ノーマル ディストリビューション 正規分布

“outlier” は平均をゆがめる原因になりやすく、報告で必ず触れたいキーワードです。

“percentile”(百分位)は、ある値が全体の下から何%の位置にあるかを表します。

「上位10%の顧客」のように、分布の中の位置を語るときに便利な単語です。

傾向・変化を表す用語

増減や推移を語るときに欠かせない単語です。

動詞・名詞をセットで覚えると、文を組み立てやすくなります。

英語 読み方 日本語訳
trend トレンド 傾向・推移
increase / rise インクリース/ライズ 増加する
decrease / decline ディクリース/ディクライン 減少する
peak ピーク 頂点・最大に達する
plateau プラトー 頭打ちになる
fluctuate フラクチュエイト 変動する
spike スパイク 急増・急上昇
dip ディップ 一時的な下落

“spike”(急増)と “dip”(一時的な下落)は、グラフの山と谷を端的に言い表せます。

“plateau”(頭打ち)は、伸びが止まって横ばいになった状態を表す名詞・動詞です。

成長の鈍化を婉曲に伝えたいときに、よく使われる単語です。

比較・関係を表す用語

2つ以上の数値を結びつけて語るときの単語です。

相関と因果を取り違えないよう、意味の違いを意識します。

英語 読み方 日本語訳
correlation コリレーション 相関
causation コーゼーション 因果関係
ratio レイショ 比率
proportion プロポーション 割合
benchmark ベンチマーク 基準値
baseline ベースライン 基準線・出発点
variable バリアブル 変数

“correlation”(相関)があっても “causation”(因果)とは限らない、という区別は分析の基本です。

“benchmark”(基準値)は、自社や過去の数値と比べるための目安を指します。

“baseline”(基準線)は施策を始める前の出発点を表し、効果測定の比較対象になります。

グラフ・チャートの用語

図の種類や構成要素を表す単語です。

軸や凡例の呼び方を知ると、グラフ説明がスムーズになります。

英語 読み方 日本語訳
bar chart バー チャート 棒グラフ
line graph ライン グラフ 折れ線グラフ
pie chart パイ チャート 円グラフ
scatter plot スキャター プロット 散布図
histogram ヒストグラム ヒストグラム
axis アクシス
legend レジェンド 凡例
data point データ ポイント データ点

“scatter plot”(散布図)は2変数の関係を見るのに使い、相関の説明とセットでよく登場します。

データ操作・処理の用語

データを整え、集計・加工する作業に関わる単語です。

実務でツールを操作するときにも頻出します。

英語 読み方 日本語訳
dataset データセット データの集まり
filter フィルター 絞り込む
aggregate アグリゲイト 集計する
sort ソート 並べ替える
clean (data) クリーン データを整える(前処理)
missing value ミッシング バリュー 欠損値
duplicate デュプリケイト 重複
query クエリ 問い合わせ(抽出指示)

“clean the data”(データクリーニング)は、欠損値や重複を取り除く前処理を指す定番の言い方です。

“query”(クエリ)は、データベースから必要な情報を取り出すための指示を指します。

“aggregate”(集計する)は、個々のデータを合計や平均にまとめる操作を表します。

データの種類を表す用語

データそのものの性質を分類する単語です。

分析手法の選び方は、データの種類によって変わります。

英語 読み方 日本語訳
quantitative data クオンティタティブ データ 定量データ(数値)
qualitative data クオリタティブ データ 定性データ(言葉・分類)
categorical data カテゴリカル データ カテゴリーデータ
time series タイム シリーズ 時系列データ
raw data ロー データ 生データ(未加工)
structured data ストラクチャード データ 構造化データ
variable バリアブル 変数

“quantitative”(定量)と “qualitative”(定性)は1文字違いで紛らわしいので、発音とつづりを意識します。

“time series”(時系列)は売上推移のように、時間軸に沿って並ぶデータを指します。

予測・モデルの入り口の用語

少し進んだ分析や、機械学習に触れるときに出てくる単語です。

細かい数式を知らなくても、語の意味だけ押さえると会話についていけます。

英語 読み方 日本語訳
model モデル モデル(予測の仕組み)
regression リグレッション 回帰(分析)
prediction プリディクション 予測
accuracy アキュラシー 正確さ
training data トレーニング データ 学習用データ
overfitting オーバーフィッティング 過学習
weight ウェイト 重み

“regression”(回帰)は、ある変数から別の変数を予測する代表的な手法を指します。

“overfitting”(過学習)は、学習データに合わせすぎて新しいデータに弱くなる状態を表します。

分析・考察の用語

結果を解釈し、示唆を引き出す段階で使う単語です。

事実の報告から一歩進んだ語彙になります。

英語 読み方 日本語訳
insight インサイト 洞察・示唆
takeaway テイクアウェイ 要点・学び
finding ファインディング 発見・調査結果
assumption アサンプション 前提・仮定
hypothesis ハイポセシス 仮説
significant シグニフィカント 有意な・重要な
estimate エスティメイト 推定する・見積もる

“significant” は日常では「重要な」ですが、統計では「有意な(偶然とは考えにくい)」を意味します。

“hypothesis”(仮説)は検証の出発点で、データで支持されるか確かめる対象になります。

レポート・指標の用語

ビジネスの数値レポートで頻出する指標系の単語です。

会議でそのまま飛び交うことも多い語彙です。

英語 読み方 日本語訳
metric メトリック 指標
KPI ケー ピー アイ 重要業績評価指標
forecast フォーキャスト 予測
growth rate グロース レイト 成長率
conversion rate コンバージョン レイト 転換率(成約率)
year over year イヤー オーバー イヤー 前年同期比
breakdown ブレイクダウン 内訳

“year over year”(前年同期比、YoY)は、季節要因をならして比較したいときの定番指標です。

“breakdown”(内訳)は、合計を項目ごとに分解して見せるときに使う名詞です。

混同しやすい単語の使い分け

意味が近く、英語学習者がつまずきやすい単語をまとめます。

違いを一度整理すると、報告での誤用が減ります。

英語 読み方 日本語訳
percent vs percentage point パーセント/パーセンテージ ポイント 比率の変化/率そのものの差
data vs datum データ/デイタム データ(複数)/1件のデータ
accuracy vs precision アキュラシー/プリシジョン 正確さ/精密さ
estimate vs forecast エスティメイト/フォーキャスト 現状の推定/将来の予測
trend vs fluctuation トレンド/フラクチュエーション 一定方向の傾向/短期的な変動

“accuracy”(真の値への近さ)と “precision”(測定のばらつきの小ささ)は、英語でも混同されやすい対です。

よくある質問

“mean” と “average” はどちらを使えばいいですか?

日常会話では “average”、統計やレポートの厳密な文脈では “mean” が好まれます。

どちらも算術平均を指す点は同じです。

“significant” は「重要」と訳していいですか?

一般的な文では「重要な」で問題ありません。

ただし統計の文脈では「有意な(偶然では説明しにくい)」という専門的な意味になるので、文脈で判断します。

“data” は単数ですか複数ですか?

本来は “datum”(1件)の複数形ですが、現代英語では集合名詞として単数扱いも広く使われます。

“The data shows …” と “The data show …” はどちらも見かけます。

グラフの種類の単語を効率よく覚えるコツは?

形と用途をセットで覚えるのが近道です。

棒グラフは比較、折れ線は推移、円グラフは構成比、散布図は相関、と対応づけると思い出しやすくなります。

まとめ

データ分析の英語は、テーマ別に頻出単語を押さえておくと読解も会話も格段に楽になります。

  • 統計・分布・傾向の基礎語は、レポートの土台として最優先で覚える。
  • 相関と因果、percent と percentage point など、混同しやすい対は早めに整理する。
  • グラフの単語は、形と用途をセットにすると定着しやすい。

単語が頭に入ったら、実際の報告フレーズや会話の流れと組み合わせて練習すると、本番で言葉に詰まりません。

関連記事:英語の会議で使えるフレーズ

📚 英語をもっと伸ばすなら、まず語彙から。

専門トピックの表現を使いこなす土台になるのは語彙力。英語の頻出単語を頻度順に、発音・日本語訳・用例つきでまとめたPDF単語帳です。

入門編 → 初心者編 の順がおすすめ/2冊セットなら15%お得

タイトルとURLをコピーしました