2013-10-15

尺度水準とデータベースのキー、あるいはハッシュ・二分木・配列の使い分け

あたりまえっていえば、あたりまえなんだけど。

量的指標の尺度水準というものがある。実数でなにかを表わそうとするときの表現の仕方を分類したもので、扱いがこれにより異なる。定義はウィキぺを見てもらうとして、これらは記号に許される2項演算子のセットに根がある。
  • 名義尺度
    • 2つの値の比較が↑できない↓できる
  • 順番尺度
    • 2つの値の差を計算すること(減算)が↑できない↓できる
  • 間隔尺度
    • 2つの値の比を計算すること(除算)が↑できない↓できる
  • 比率尺度
データベースのキーというか、少量データのキーで他の(典型的には多量の)データをあらわすやり方にも、似たような階梯があらわれるんだけど、
  •  ハッシュが使える
    • 2つの値の比較が↑できない↓できる
  • 二分木が使える
    • 次の3つが仮定↑できない↓できる
      • 2つの値の差を計算できる
      • その間にいくつの他の値が入りうるか算出できる
      • 値の分布を最大値から最小値まで見たときに「空き地」がもったいないと思うほどは多くない
  • 配列にいれておける
てな感じになってしまう。

説明するまでもなく、配列モデルの適用条件が美しくない。なにかまったく違った整理をすれば美しい数理が見えてくるのかもしれないと数日考えていたが、とりあえず今の私にゃ無理だ。



0 件のコメント:

コメントを投稿