タガログ語のデータ分析頻出単語|統計・指標のボキャブラリー

タガログ語

タガログ語のデータ分析記事や会議で、知らない単語が出てくるたびに手が止まる。そんな悩みを持つ方へ。

データ分析のタガログ語は、頻出する単語をテーマ別に押さえておくと、読むのも話すのも一気に楽になります。ポイントは、専門語の多くがそのまま英語で使われる「Taglish(タグリッシュ)」だと知っておくことです。

この記事で分かることは次の3つです。

  • 統計・グラフ・傾向・データ操作など、分野別の必須ボキャブラリー
  • レポートや会議でそのまま使える、各単語の日本語訳と読み方
  • 純タガログ語か英語のままかなど、現場での使われ方のニュアンス

以下の表では、英語由来でそのまま使う語はカタカナ読みも英語に近い形で示しています。フィリピンの職場では average や outlier を無理にタガログ語へ訳さず、そのまま使うのが自然だと覚えておきましょう。

統計の基本用語

まずは、平均やばらつきを表す基礎的な統計用語です。

これらは数値レポートのいたるところに出てくる土台になります。多くは英語のまま、一部は純タガログ語の言い回しもあります。

タガログ語 読み方(カタカナ読み) 日本語訳
average / katamtaman アベレージ/カタムタマン 平均
median ミディアン 中央値
mode モード 最頻値
standard deviation スタンダード ディビエーション 標準偏差
variance バリアンス 分散
saklaw / range サクラウ/レンジ 範囲(最大−最小)
sample size サンプル サイズ 標本数

average は純タガログ語で katamtaman とも言えますが、職場のレポートでは average のまま使うのが普通です。standard deviation(標準偏差)は、データが平均からどれだけ散らばっているかを示す指標で、ほぼ英語のまま発音されます。

分布・ばらつきの用語

データの「散らばり方」や「偏り」を表す単語です。

平均だけでは見えない実態を語るときに役立ちます。outlier や skew はそのまま英語で使うのが一般的です。

タガログ語 読み方(カタカナ読み) 日本語訳
distribution ディストリビューション 分布
skew / pagkiling スキュー/パグキリン 偏り(ゆがみ)
spread / kalat スプレッド/カラット ばらつき
outlier アウトライアー 外れ値
percentile パーセンタイル 百分位
quartile クォータイル 四分位
normal distribution ノーマル ディストリビューション 正規分布

outlier は平均をゆがめる原因になりやすく、報告で必ず触れたいキーワードです。pagkiling(偏り)は純タガログ語ですが、技術的な文脈では skew をそのまま使う人が多いです。

傾向・変化を表す用語

増減や推移を語るときに欠かせない単語です。

動詞は純タガログ語、名詞は英語、と混在しやすい分野です。tumaas / bumaba のような動詞は日常のタガログ語で頻出します。

タガログ語 読み方(カタカナ読み) 日本語訳
trend / kalakaran トレンド/カラカラン 傾向・推移
tumaas / umakyat トゥマアス/ウマクヤット 増加する
bumaba / lumiit ブマバ/ルミイト 減少する
peak / rurok ピーク/ルロク 頂点・最大に達する
plateau / pumatag プラトー/プマタグ 頭打ちになる
magbago-bago / fluctuate マグバゴ バゴ/フラクチュエイト 変動する
biglang pagtaas / spike ビグラン パグタアス/スパイク 急増・急上昇
biglang pagbaba / dip ビグラン パグババ/ディップ 一時的な下落

spike(急増)と dip(一時的な下落)は、グラフの山と谷を端的に言い表せます。タガログ語では biglang pagtaas / biglang pagbaba と言い換えられます。

pumatag(頭打ち)は伸びが止まった状態を表し、成長鈍化を婉曲に伝えたいときに便利です。

比較・関係を表す用語

2つ以上の数値を結びつけて語るときの単語です。

相関と因果を取り違えないよう、意味の違いを意識します。correlation と causation はそのまま英語で使われます。

タガログ語 読み方(カタカナ読み) 日本語訳
correlation / kaugnayan コリレーション/カウグナヤン 相関
causation / sanhi コーゼーション/サンヒ 因果関係
ratio レイショ 比率
proporsyon プロポルシヨン 割合
benchmark ベンチマーク 基準値
baseline ベースライン 基準線・出発点
variable バリアブル 変数

correlation(相関)があっても causation(因果)とは限らない、という区別は分析の基本です。kaugnayan(関係)と sanhi(原因)という純タガログ語を知っておくと、英語が使えない相手にも説明できます。

グラフ・チャートの用語

図の種類や構成要素を表す単語です。

軸や凡例の呼び方を知ると、グラフ説明がスムーズになります。グラフの種類はほぼ英語のままです。

タガログ語 読み方(カタカナ読み) 日本語訳
bar chart バー チャート 棒グラフ
line graph ライン グラフ 折れ線グラフ
pie chart パイ チャート 円グラフ
scatter plot スキャター プロット 散布図
histogram ヒストグラム ヒストグラム
axis / aksis アクシス/アクシス
legend レジェンド 凡例
data point データ ポイント データ点

scatter plot(散布図)は2変数の関係を見るのに使い、相関の説明とセットでよく登場します。グラフ用語を無理にタガログ語化する人はほとんどいないので、英語のまま覚えて問題ありません。

データ操作・処理の用語

データを整え、集計・加工する作業に関わる単語です。

実務でツールを操作するときにも頻出します。英語の動詞に i- や mag- を付ける Taglish が典型です。

タガログ語 読み方(カタカナ読み) 日本語訳
dataset データセット データの集まり
i-filter / salain イフィルター/サライン 絞り込む
i-aggregate / tipunin イアグリゲイト/ティプニン 集計する
i-sort / ayusin イソート/アユシン 並べ替える
i-clean ang data イクリーン アン データ データを整える(前処理)
missing value / kulang na datos ミッシング バリュー/クラン ナ ダトス 欠損値
duplicate / doble デュプリケイト/ドブレ 重複
query クエリ 問い合わせ(抽出指示)

i-clean ang data(データクリーニング)は、欠損値や重複を取り除く前処理を指す定番の言い方です。i-filter, i-sort のように、英語の動詞に接頭辞 i- を付けて活用するのがフィリピンの職場では自然です。

データの種類を表す用語

データそのものの性質を分類する単語です。

分析手法の選び方は、データの種類によって変わります。専門語はほぼ英語のままです。

タガログ語 読み方(カタカナ読み) 日本語訳
quantitative data クオンティタティブ データ 定量データ(数値)
qualitative data クオリタティブ データ 定性データ(言葉・分類)
categorical data カテゴリカル データ カテゴリーデータ
time series タイム シリーズ 時系列データ
raw data / hilaw na datos ロー データ/ヒラウ ナ ダトス 生データ(未加工)
structured data ストラクチャード データ 構造化データ
datos / data ダトス/データ データ

quantitative(定量)と qualitative(定性)は1文字違いで紛らわしいので、発音とつづりを意識します。datos は data の純タガログ語で、ニュースや一般文書でよく見かけます。

予測・モデルの入り口の用語

少し進んだ分析や、機械学習に触れるときに出てくる単語です。

細かい数式を知らなくても、語の意味だけ押さえると会話についていけます。この分野はほぼ全て英語のままです。

タガログ語 読み方(カタカナ読み) 日本語訳
model モデル モデル(予測の仕組み)
regression リグレッション 回帰(分析)
prediction / hula プリディクション/フラ 予測
accuracy アキュラシー 正確さ
training data トレーニング データ 学習用データ
overfitting オーバーフィッティング 過学習
weight / timbang ウェイト/ティンバン 重み

regression(回帰)は、ある変数から別の変数を予測する代表的な手法を指します。prediction は純タガログ語の hula(予想)でも通じますが、技術文脈では prediction のままが無難です。

分析・考察の用語

結果を解釈し、示唆を引き出す段階で使う単語です。

事実の報告から一歩進んだ語彙になります。insight や takeaway はそのまま英語で使われます。

タガログ語 読み方(カタカナ読み) 日本語訳
insight インサイト 洞察・示唆
takeaway テイクアウェイ 要点・学び
natuklasan / finding ナトゥクラサン/ファインディング 発見・調査結果
assumption / palagay アサンプション/パラガイ 前提・仮定
hypothesis ハイポセシス 仮説
significant / makabuluhan シグニフィカント/マカブルハン 有意な・重要な
tantiyahin / estimate タンティヤヒン/エスティメイト 推定する・見積もる

significant は日常では makabuluhan(重要な)ですが、統計では「有意な(偶然とは考えにくい)」を意味します。natuklasan(発見した)は report の結論部分でよく使われる純タガログ語です。

レポート・指標の用語

ビジネスの数値レポートで頻出する指標系の単語です。

会議でそのまま飛び交うことも多い語彙です。KPI や forecast は完全に英語のままです。

タガログ語 読み方(カタカナ読み) 日本語訳
metric メトリック 指標
KPI ケイ ピー アイ 重要業績評価指標
forecast フォーキャスト 予測
growth rate グロース レイト 成長率
conversion rate コンバージョン レイト 転換率(成約率)
year over year イヤー オーバー イヤー 前年同期比
breakdown / hatian ブレイクダウン/ハティアン 内訳

year over year(前年同期比、YoY)は、季節要因をならして比較したいときの定番指標です。breakdown(内訳)は純タガログ語で hatian とも言えますが、会議では breakdown のまま使う人が多いです。

混同しやすい単語の使い分け

意味が近く、学習者がつまずきやすい単語をまとめます。

違いを一度整理すると、報告での誤用が減ります。

タガログ語 読み方(カタカナ読み) 日本語訳
percent vs percentage point パーセント/パーセンテージ ポイント 比率の変化/率そのものの差
datos vs datum ダトス/デイタム データ(複数)/1件のデータ
accuracy vs precision アキュラシー/プリシジョン 正確さ/精密さ
estimate vs forecast エスティメイト/フォーキャスト 現状の推定/将来の予測
trend vs fluctuation トレンド/フラクチュエーション 一定方向の傾向/短期的な変動

accuracy(真の値への近さ)と precision(測定のばらつきの小ささ)は、英語でも混同されやすい対です。estimate(現状の推定)と forecast(将来の予測)も、時間軸が違う点を押さえておきましょう。

よくある質問

Q. データ分析の専門語はタガログ語に訳すべきですか?

いいえ、無理に訳さなくて大丈夫です。フィリピンの職場では average, outlier, KPI, forecast などをそのまま英語で使う Taglish が標準です。

kaugnayan(相関)や sanhi(因果)のような純タガログ語も存在しますが、技術的な会議では英語のままが通じやすいです。

Q. 英語の動詞をタガログ語の文に入れるにはどうしますか?

接頭辞 i- や mag- を付けます。i-filter(絞り込む)、i-sort(並べ替える)、mag-analyze(分析する)のように使うのが自然です。

これは Taglish の典型的な作り方で、フィリピン人の同僚にもすぐ伝わります。

Q. significant は「重要」と訳していいですか?

一般的な文では makabuluhan(重要な)で問題ありません。

ただし統計の文脈では「有意な(偶然では説明しにくい)」という専門的な意味になるので、文脈で判断します。この意味では英語の significant をそのまま使うことが多いです。

Q. data はタガログ語で何と言いますか?

純タガログ語では datos です。ニュースや一般文書では datos がよく使われます。

ただしIT・分析の現場では data のまま使うのが普通で、datos と data はほぼ同じ意味として通じます。

Q. グラフの種類の単語を効率よく覚えるコツは?

形と用途をセットで覚えるのが近道です。bar chart は比較、line graph は推移、pie chart は構成比、scatter plot は相関、と対応づけると思い出しやすくなります。

これらはタガログ語でも英語のまま使うので、英語の名称を覚えればそのまま現場で通用します。

まとめ

データ分析のタガログ語は、テーマ別に頻出単語を押さえておくと読解も会話も格段に楽になります。

  • 統計・分布・傾向の基礎語は、レポートの土台として最優先で覚える。
  • 専門語の多くは英語のまま使う Taglish で、動詞は i- や mag- を付けて活用する。
  • 相関と因果、percent と percentage point など、混同しやすい対は早めに整理する。

単語が頭に入ったら、実際の報告フレーズや会話の流れと組み合わせて練習すると、本番で言葉に詰まりません。

関連記事:タガログ語のプレゼンで使えるフレーズ

タイトルとURLをコピーしました