インドネシア語のデータ分析頻出単語|統計・指標のボキャブラリー

インドネシア語

インドネシア語のデータ分析記事や会議で、知らない単語が出てくるたびに手が止まる。そんな悩みを持つ方へ。

データ分析のインドネシア語は、頻出する単語をテーマ別に押さえておくと、読むのも話すのも一気に楽になります。

この記事で分かることは次の3つです。

  • 統計・グラフ・傾向・データ操作など、分野別の必須ボキャブラリー
  • レポートや会議でそのまま使える、各単語の日本語訳と読み方
  • 似た意味で混同しやすい単語の、ニュアンスの違い

統計の基本用語

まずは、平均やばらつきを表す基礎的な統計用語です。

これらは数値レポートのいたるところに出てくる土台になります。

インドネシア語 読み方(カタカナ読み) 日本語訳
rata-rata ラタ ラタ 平均
median / nilai tengah メディアン/ニライ トゥンガ 中央値
modus モドゥス 最頻値
simpangan baku シンパンガン バク 標準偏差
varians / ragam ファリアンス/ラガム 分散
rentang レンタン 範囲(最大−最小)
ukuran sampel ウクラン サンペル 標本数

「rata-rata」は日常でも「平均」として広く使われ、レポートでも最頻出の語です。

「simpangan baku」(標準偏差)は、データが平均からどれだけ散らばっているかを示す指標です。

レポートで「平均は同じでも中身は違う」と説明したい場面で、この単語が役立ちます。

分布・ばらつきの用語

データの「散らばり方」や「偏り」を表す単語です。

平均だけでは見えない実態を語るときに役立ちます。

インドネシア語 読み方(カタカナ読み) 日本語訳
distribusi / sebaran ディストリブシ/スバラン 分布
kemiringan クミリンガン 偏り(ゆがみ)
penyebaran プニュバラン ばらつき
pencilan プンチラン 外れ値
persentil プルセンティル 百分位
kuartil クアルティル 四分位
distribusi normal ディストリブシ ノルマル 正規分布

「pencilan」は平均をゆがめる原因になりやすく、報告で必ず触れたいキーワードです。

「persentil」(百分位)は、ある値が全体の下から何%の位置にあるかを表します。

「上位10%の顧客」のように、分布の中の位置を語るときに便利な単語です。

傾向・変化を表す用語

増減や推移を語るときに欠かせない単語です。

動詞・名詞をセットで覚えると、文を組み立てやすくなります。

インドネシア語 読み方(カタカナ読み) 日本語訳
tren トレン 傾向・推移
naik / meningkat ナイク/ムニンカッ 増加する
turun / menurun トゥルン/ムヌルン 減少する
puncak / memuncak プンチャッ/ムムンチャッ 頂点・最大に達する
mendatar ムンダタル 頭打ちになる・横ばい
berfluktuasi ブルフルクトゥアシ 変動する
lonjakan ロンジャカン 急増・急上昇
penurunan sesaat プヌルナン ススアッ 一時的な下落

「lonjakan」(急増)と「penurunan sesaat」(一時的な下落)は、グラフの山と谷を端的に言い表せます。

「mendatar」(頭打ち・横ばい)は、伸びが止まって平らになった状態を表す動詞です。

成長の鈍化を婉曲に伝えたいときに、よく使われる単語です。

比較・関係を表す用語

2つ以上の数値を結びつけて語るときの単語です。

相関と因果を取り違えないよう、意味の違いを意識します。

インドネシア語 読み方(カタカナ読み) 日本語訳
korelasi コレラシ 相関
sebab-akibat スバッ アキバッ 因果関係
rasio ラシオ 比率
proporsi プロポルシ 割合
tolok ukur トロッ ウクル 基準値・ベンチマーク
garis dasar ガリス ダサル 基準線・出発点
variabel ファリアベル 変数

「korelasi」(相関)があっても「sebab-akibat」(因果)とは限らない、という区別は分析の基本です。

「tolok ukur」(基準値)は、自社や過去の数値と比べるための目安を指します。

「garis dasar」(基準線)は施策を始める前の出発点を表し、効果測定の比較対象になります。

グラフ・チャートの用語

図の種類や構成要素を表す単語です。

軸や凡例の呼び方を知ると、グラフ説明がスムーズになります。

インドネシア語 読み方(カタカナ読み) 日本語訳
diagram batang ディアグラム バタン 棒グラフ
grafik garis グラフィッ ガリス 折れ線グラフ
diagram lingkaran ディアグラム リンカラン 円グラフ
diagram sebar ディアグラム スバル 散布図
histogram ヒストグラム ヒストグラム
sumbu スンブ
keterangan / legenda クトゥランガン/レゲンダ 凡例
titik data ティティッ ダタ データ点

「diagram sebar」(散布図)は2変数の関係を見るのに使い、相関の説明とセットでよく登場します。

データ操作・処理の用語

データを整え、集計・加工する作業に関わる単語です。

実務でツールを操作するときにも頻出します。

インドネシア語 読み方(カタカナ読み) 日本語訳
kumpulan data クンプラン ダタ データの集まり
menyaring ムニャリン 絞り込む
mengagregasi ムンガグレガシ 集計する
mengurutkan ムングルッカン 並べ替える
membersihkan data ムンブルシカン ダタ データを整える(前処理)
nilai hilang ニライ ヒラン 欠損値
duplikat ドゥプリカッ 重複
kueri クエリ 問い合わせ(抽出指示)

「membersihkan data」(データクリーニング)は、欠損値や重複を取り除く前処理を指す定番の言い方です。

「kueri」(クエリ)は、データベースから必要な情報を取り出すための指示を指します。

「mengagregasi」(集計する)は、個々のデータを合計や平均にまとめる操作を表します。

データの種類を表す用語

データそのものの性質を分類する単語です。

分析手法の選び方は、データの種類によって変わります。

インドネシア語 読み方(カタカナ読み) 日本語訳
data kuantitatif ダタ クアンティタティフ 定量データ(数値)
data kualitatif ダタ クアリタティフ 定性データ(言葉・分類)
data kategori ダタ カテゴリ カテゴリーデータ
deret waktu デレッ ワクトゥ 時系列データ
data mentah ダタ ムンタ 生データ(未加工)
data terstruktur ダタ トゥルストルクトゥル 構造化データ
variabel ファリアベル 変数

「kuantitatif」(定量)と「kualitatif」(定性)は1文字違いで紛らわしいので、発音とつづりを意識します。

「deret waktu」(時系列)は売上推移のように、時間軸に沿って並ぶデータを指します。

予測・モデルの入り口の用語

少し進んだ分析や、機械学習に触れるときに出てくる単語です。

細かい数式を知らなくても、語の意味だけ押さえると会話についていけます。

インドネシア語 読み方(カタカナ読み) 日本語訳
model モデル モデル(予測の仕組み)
regresi レグレシ 回帰(分析)
prediksi プレディクシ 予測
akurasi アクラシ 正確さ
data latih ダタ ラティ 学習用データ
overfitting / terlalu pas オーバーフィッティン/トゥルラル パス 過学習
bobot ボボッ 重み

「regresi」(回帰)は、ある変数から別の変数を予測する代表的な手法を指します。

「overfitting」(過学習)は、学習データに合わせすぎて新しいデータに弱くなる状態を表します。

分析・考察の用語

結果を解釈し、示唆を引き出す段階で使う単語です。

事実の報告から一歩進んだ語彙になります。

インドネシア語 読み方(カタカナ読み) 日本語訳
wawasan ワワサン 洞察・示唆
poin utama ポイン ウタマ 要点・学び
temuan トゥムアン 発見・調査結果
asumsi アスムシ 前提・仮定
hipotesis ヒポテシス 仮説
signifikan シグニフィカン 有意な・重要な
memperkirakan ムンプルキラカン 推定する・見積もる

「signifikan」は日常では「重要な」ですが、統計では「有意な(偶然とは考えにくい)」を意味します。

「hipotesis」(仮説)は検証の出発点で、データで支持されるか確かめる対象になります。

レポート・指標の用語

ビジネスの数値レポートで頻出する指標系の単語です。

会議でそのまま飛び交うことも多い語彙です。

インドネシア語 読み方(カタカナ読み) 日本語訳
metrik メトリッ 指標
KPI / indikator kinerja カー ペー イー/インディカトル キヌルジャ 重要業績評価指標
perkiraan / ramalan プルキラアン/ラマラン 予測
laju pertumbuhan ラジュ プルトゥンブハン 成長率
tingkat konversi ティンカッ コンフェルシ 転換率(成約率)
dibanding tahun lalu ディバンディン タフン ラル 前年同期比
rincian リンチアン 内訳

「dibanding tahun lalu」(前年同期比、YoY)は、季節要因をならして比較したいときの定番表現です。

「rincian」(内訳)は、合計を項目ごとに分解して見せるときに使う名詞です。

混同しやすい単語の使い分け

意味が近く、学習者がつまずきやすい単語をまとめます。

違いを一度整理すると、報告での誤用が減ります。

インドネシア語 読み方(カタカナ読み) 日本語訳
persen vs poin persentase プルセン/ポイン プルセンタセ 比率の変化/率そのものの差
data vs satu data ダタ/サトゥ ダタ データ(集合)/1件のデータ
akurasi vs presisi アクラシ/プレシシ 正確さ/精密さ
perkiraan vs ramalan プルキラアン/ラマラン 現状の推定/将来の予測
tren vs fluktuasi トレン/フルクトゥアシ 一定方向の傾向/短期的な変動

「akurasi」(真の値への近さ)と「presisi」(測定のばらつきの小ささ)は、インドネシア語でも混同されやすい対です。

よくある質問

Q. rata-rata と median はどう使い分けますか?

A. どちらも代表値ですが、外れ値があるときは median(中央値)の方が実態を表します。rata-rata は外れ値に引っ張られやすいので、両方を併記すると誤解が減ります。

Q. signifikan は「重要」と訳していいですか?

A. 一般的な文では「重要な」で問題ありません。ただし統計の文脈では「有意な(偶然では説明しにくい)」という専門的な意味になるので、文脈で判断します。

Q. data は単数ですか複数ですか?

A. インドネシア語の名詞は単複の区別がなく、data はそのまま集合としても1件としても使えます。1件を強調したいときは satu data や satu titik data と言うと明確です。

Q. グラフの種類の単語を効率よく覚えるコツは?

A. 形と用途をセットで覚えるのが近道です。diagram batang は比較、grafik garis は推移、diagram lingkaran は構成比、diagram sebar は相関、と対応づけると思い出しやすくなります。

まとめ

データ分析のインドネシア語は、テーマ別に頻出単語を押さえておくと読解も会話も格段に楽になります。

  • 統計・分布・傾向の基礎語は、レポートの土台として最優先で覚える。
  • 相関と因果、persen と poin persentase など、混同しやすい対は早めに整理する。
  • グラフの単語は、形と用途をセットにすると定着しやすい。

単語が頭に入ったら、実際の報告フレーズや会話の流れと組み合わせて練習すると、本番で言葉に詰まりません。

関連記事:英語の会議で使えるフレーズ

タイトルとURLをコピーしました