英語のデータ分析記事や会議で、知らない単語が出てくるたびに手が止まる。そんな悩みを持つ方へ。
データ分析の英語は、頻出する単語をテーマ別に押さえておくと、読むのも話すのも一気に楽になります。
この記事で分かることは次の3つです。
- 統計・グラフ・傾向・データ操作など、分野別の必須ボキャブラリー
- レポートや会議でそのまま使える、各単語の日本語訳と読み方
- 似た意味で混同しやすい単語の、ニュアンスの違い
統計の基本用語
まずは、平均やばらつきを表す基礎的な統計用語です。
これらは数値レポートのいたるところに出てくる土台になります。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| average / mean | アベレージ/ミーン | 平均 |
| median | ミディアン | 中央値 |
| mode | モード | 最頻値 |
| standard deviation | スタンダード ディビエーション | 標準偏差 |
| variance | バリアンス | 分散 |
| range | レンジ | 範囲(最大−最小) |
| sample size | サンプル サイズ | 標本数 |
“mean” と “average” はほぼ同義ですが、統計の文脈ではより厳密な “mean” が好まれます。
“standard deviation”(標準偏差)は、データが平均からどれだけ散らばっているかを示す指標です。
レポートで「平均は同じでも中身は違う」と説明したい場面で、この単語が役立ちます。
分布・ばらつきの用語
データの「散らばり方」や「偏り」を表す単語です。
平均だけでは見えない実態を語るときに役立ちます。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| distribution | ディストリビューション | 分布 |
| skew | スキュー | 偏り(ゆがみ) |
| spread | スプレッド | ばらつき |
| outlier | アウトライアー | 外れ値 |
| percentile | パーセンタイル | 百分位 |
| quartile | クォータイル | 四分位 |
| normal distribution | ノーマル ディストリビューション | 正規分布 |
“outlier” は平均をゆがめる原因になりやすく、報告で必ず触れたいキーワードです。
“percentile”(百分位)は、ある値が全体の下から何%の位置にあるかを表します。
「上位10%の顧客」のように、分布の中の位置を語るときに便利な単語です。
傾向・変化を表す用語
増減や推移を語るときに欠かせない単語です。
動詞・名詞をセットで覚えると、文を組み立てやすくなります。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| trend | トレンド | 傾向・推移 |
| increase / rise | インクリース/ライズ | 増加する |
| decrease / decline | ディクリース/ディクライン | 減少する |
| peak | ピーク | 頂点・最大に達する |
| plateau | プラトー | 頭打ちになる |
| fluctuate | フラクチュエイト | 変動する |
| spike | スパイク | 急増・急上昇 |
| dip | ディップ | 一時的な下落 |
“spike”(急増)と “dip”(一時的な下落)は、グラフの山と谷を端的に言い表せます。
“plateau”(頭打ち)は、伸びが止まって横ばいになった状態を表す名詞・動詞です。
成長の鈍化を婉曲に伝えたいときに、よく使われる単語です。
比較・関係を表す用語
2つ以上の数値を結びつけて語るときの単語です。
相関と因果を取り違えないよう、意味の違いを意識します。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| correlation | コリレーション | 相関 |
| causation | コーゼーション | 因果関係 |
| ratio | レイショ | 比率 |
| proportion | プロポーション | 割合 |
| benchmark | ベンチマーク | 基準値 |
| baseline | ベースライン | 基準線・出発点 |
| variable | バリアブル | 変数 |
“correlation”(相関)があっても “causation”(因果)とは限らない、という区別は分析の基本です。
“benchmark”(基準値)は、自社や過去の数値と比べるための目安を指します。
“baseline”(基準線)は施策を始める前の出発点を表し、効果測定の比較対象になります。
グラフ・チャートの用語
図の種類や構成要素を表す単語です。
軸や凡例の呼び方を知ると、グラフ説明がスムーズになります。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| bar chart | バー チャート | 棒グラフ |
| line graph | ライン グラフ | 折れ線グラフ |
| pie chart | パイ チャート | 円グラフ |
| scatter plot | スキャター プロット | 散布図 |
| histogram | ヒストグラム | ヒストグラム |
| axis | アクシス | 軸 |
| legend | レジェンド | 凡例 |
| data point | データ ポイント | データ点 |
“scatter plot”(散布図)は2変数の関係を見るのに使い、相関の説明とセットでよく登場します。
データ操作・処理の用語
データを整え、集計・加工する作業に関わる単語です。
実務でツールを操作するときにも頻出します。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| dataset | データセット | データの集まり |
| filter | フィルター | 絞り込む |
| aggregate | アグリゲイト | 集計する |
| sort | ソート | 並べ替える |
| clean (data) | クリーン | データを整える(前処理) |
| missing value | ミッシング バリュー | 欠損値 |
| duplicate | デュプリケイト | 重複 |
| query | クエリ | 問い合わせ(抽出指示) |
“clean the data”(データクリーニング)は、欠損値や重複を取り除く前処理を指す定番の言い方です。
“query”(クエリ)は、データベースから必要な情報を取り出すための指示を指します。
“aggregate”(集計する)は、個々のデータを合計や平均にまとめる操作を表します。
データの種類を表す用語
データそのものの性質を分類する単語です。
分析手法の選び方は、データの種類によって変わります。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| quantitative data | クオンティタティブ データ | 定量データ(数値) |
| qualitative data | クオリタティブ データ | 定性データ(言葉・分類) |
| categorical data | カテゴリカル データ | カテゴリーデータ |
| time series | タイム シリーズ | 時系列データ |
| raw data | ロー データ | 生データ(未加工) |
| structured data | ストラクチャード データ | 構造化データ |
| variable | バリアブル | 変数 |
“quantitative”(定量)と “qualitative”(定性)は1文字違いで紛らわしいので、発音とつづりを意識します。
“time series”(時系列)は売上推移のように、時間軸に沿って並ぶデータを指します。
予測・モデルの入り口の用語
少し進んだ分析や、機械学習に触れるときに出てくる単語です。
細かい数式を知らなくても、語の意味だけ押さえると会話についていけます。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| model | モデル | モデル(予測の仕組み) |
| regression | リグレッション | 回帰(分析) |
| prediction | プリディクション | 予測 |
| accuracy | アキュラシー | 正確さ |
| training data | トレーニング データ | 学習用データ |
| overfitting | オーバーフィッティング | 過学習 |
| weight | ウェイト | 重み |
“regression”(回帰)は、ある変数から別の変数を予測する代表的な手法を指します。
“overfitting”(過学習)は、学習データに合わせすぎて新しいデータに弱くなる状態を表します。
分析・考察の用語
結果を解釈し、示唆を引き出す段階で使う単語です。
事実の報告から一歩進んだ語彙になります。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| insight | インサイト | 洞察・示唆 |
| takeaway | テイクアウェイ | 要点・学び |
| finding | ファインディング | 発見・調査結果 |
| assumption | アサンプション | 前提・仮定 |
| hypothesis | ハイポセシス | 仮説 |
| significant | シグニフィカント | 有意な・重要な |
| estimate | エスティメイト | 推定する・見積もる |
“significant” は日常では「重要な」ですが、統計では「有意な(偶然とは考えにくい)」を意味します。
“hypothesis”(仮説)は検証の出発点で、データで支持されるか確かめる対象になります。
レポート・指標の用語
ビジネスの数値レポートで頻出する指標系の単語です。
会議でそのまま飛び交うことも多い語彙です。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| metric | メトリック | 指標 |
| KPI | ケー ピー アイ | 重要業績評価指標 |
| forecast | フォーキャスト | 予測 |
| growth rate | グロース レイト | 成長率 |
| conversion rate | コンバージョン レイト | 転換率(成約率) |
| year over year | イヤー オーバー イヤー | 前年同期比 |
| breakdown | ブレイクダウン | 内訳 |
“year over year”(前年同期比、YoY)は、季節要因をならして比較したいときの定番指標です。
“breakdown”(内訳)は、合計を項目ごとに分解して見せるときに使う名詞です。
混同しやすい単語の使い分け
意味が近く、英語学習者がつまずきやすい単語をまとめます。
違いを一度整理すると、報告での誤用が減ります。
| 英語 | 読み方 | 日本語訳 |
|---|---|---|
| percent vs percentage point | パーセント/パーセンテージ ポイント | 比率の変化/率そのものの差 |
| data vs datum | データ/デイタム | データ(複数)/1件のデータ |
| accuracy vs precision | アキュラシー/プリシジョン | 正確さ/精密さ |
| estimate vs forecast | エスティメイト/フォーキャスト | 現状の推定/将来の予測 |
| trend vs fluctuation | トレンド/フラクチュエーション | 一定方向の傾向/短期的な変動 |
“accuracy”(真の値への近さ)と “precision”(測定のばらつきの小ささ)は、英語でも混同されやすい対です。
よくある質問
“mean” と “average” はどちらを使えばいいですか?
日常会話では “average”、統計やレポートの厳密な文脈では “mean” が好まれます。
どちらも算術平均を指す点は同じです。
“significant” は「重要」と訳していいですか?
一般的な文では「重要な」で問題ありません。
ただし統計の文脈では「有意な(偶然では説明しにくい)」という専門的な意味になるので、文脈で判断します。
“data” は単数ですか複数ですか?
本来は “datum”(1件)の複数形ですが、現代英語では集合名詞として単数扱いも広く使われます。
“The data shows …” と “The data show …” はどちらも見かけます。
グラフの種類の単語を効率よく覚えるコツは?
形と用途をセットで覚えるのが近道です。
棒グラフは比較、折れ線は推移、円グラフは構成比、散布図は相関、と対応づけると思い出しやすくなります。
まとめ
データ分析の英語は、テーマ別に頻出単語を押さえておくと読解も会話も格段に楽になります。
- 統計・分布・傾向の基礎語は、レポートの土台として最優先で覚える。
- 相関と因果、percent と percentage point など、混同しやすい対は早めに整理する。
- グラフの単語は、形と用途をセットにすると定着しやすい。
単語が頭に入ったら、実際の報告フレーズや会話の流れと組み合わせて練習すると、本番で言葉に詰まりません。
関連記事:英語の会議で使えるフレーズ
📚 英語をもっと伸ばすなら、まず語彙から。
専門トピックの表現を使いこなす土台になるのは語彙力。英語の頻出単語を頻度順に、発音・日本語訳・用例つきでまとめたPDF単語帳です。
頻出500単語 入門編A1相当・最初の500語¥525 税込詳しく見る
頻出500単語 初心者編A2相当・次の500語¥525 税込詳しく見る
2冊セット(入門+初心者)入門+初心者を15%OFF¥893 税込まとめてお得に入門編 → 初心者編 の順がおすすめ/2冊セットなら15%お得


