tak0kadaの何でもノート

発声練習、生存確認用。

医学関連は 医学ノート

vim-lspとaleのインストール

YouCompleteMeをC++のためにインストールしていたが、Vim弱者のため設定が直せなくなってprabirshrestha/vim-lspw0rp/aleに乗り換えた。vim-lspもaleもコードの解析にclangdを利用しており、compile_flags.txtというファイルを置いておかないと、デフォルトの-Wall -std=c++14が採用されC++17以降の機能を使うとエラーが出る。vim-lspについてはカレントディレクトリにcompile_flags.txtを置いてやると自動で読み込んでくれるが、aleについてはその方法では解決しないため、g:ale_cpp_CXX_optionsを設定してやる必要がある。また、vim-lspについてはvimのvirtualtextという機能を使ってエラー表示をインラインにしてくれるが、これもちょっとうるさいので出ないようにした。

続きを読む

空間分割アルゴリズム

三角形に分割された閉曲面(球面)と複数の半直線があったとき、それぞれが交差するかどうかの判定をしたい。レイトレーシングで使用されるようなアルゴリズムとしてはBVH、Quadtree、Octreeなどが見つかった。

BVH (Bounding Volume Hierarchies)は、領域を木構造に分割して、AABBという直方体との交差判定を行うことで、オブジェクトとの交差の判定回数を減らす方法である。この方法は、疎にオブジェクトが散らばっている場合、木構造が容易に定まり、光線の大半はオブジェクトと交差しないため特に有効だと思われる。

今回の状況を考えると、三角形は球面を全て埋め尽くしているため半直線は必ずいずれかの三角形と交差すること、頂点の座標は極座標で与えれば2次元であることが特徴的である。四分木を用いて三角形を含む「長方形」を事前に処理しておくのが良さそうである。

(とはいえ実装は出来れば回避したく、たぶん使わないのでこのページは開きすぎたタブの供養にあたる)

続きを読む

三角メッシュ用のライブラリ書いた

GitHub - tak0kada/cnthd: Halfedge data structure for triangular mesh
ハーフエッジデータ構造のC++ライブラリ。面の向き付けがバラバラなファイルに対応しようと思っていたがバグを出してしまって(しかもそれほど使わない機能)書き直す時間が惜しいのでまともなファイルが来るのが前提になっている。テストもいい加減で目視で確かめただけである。以下は使用例。

続きを読む

n単体の作り方

$(1,1,\ldots,1)^{t}$をQR分解して得られるQ因子は直交行列でかつ、1列目が等しい。ここからn個のn-1次元行ベクトルを取ると、n単体が得られる。 お気持ち証明としては、n個の正規直交基底を、ある1つの次元$z$の値が同じになるように取って、その後その次元$z$の向きに正射影したものを考えるとそんな気がしてくる。

# https://mathoverflow.net/questions/38724/coordinates-of-vertices-of-regular-simplex
simplex <- function(n) {
    qr.Q(qr(matrix(1,nrow=n)),complete=T)[,-1]
}

pythonで.RDataファイルの中身(array)を読み込む

import rpy2.robjects as ro

# RDataの中に入っているデータについている名前は事前にRで確認しておく
# arrayの次元はhoge$dimで取れないので下記リンクと異なる
ro.reval("load(\"test.RData\"); data<-hoge; shape<-dim(hoge)")

# https://stackoverflow.com/questions/31271181/how-to-convert-an-r-complex-matrix-into-a-numpy-array-using-rpy2
data = np.array(list(ro.r.data)).reshape(ro.r.shape, order='F')
print(data.shape) # (3, 90795, 441)

Wasserstein距離

https://twitter.com/yoriyuki/status/1126423987444015104を見かけた。Wassersteinとは何か調べると、Wasserstein GAN と Kantorovich-Rubinstein 双対性という記事を見つけた。DeepLearningは理解していないが、線形代数的な話題として捉えられるらしい。

  • 距離関数を適切に(どうやって?)定められたとすると、
    • 離散確率分布の距離をEMDとして定義できる
    • 極限を取ったものがWasserstein距離になる
  • EMDを計算するためには輸送にかかるコストを計算することになる
    • 双対問題を考えると、全コストの計算をせずにEMDを計算できる
    • 双対問題を解くので十分な理論的な根拠はFarkasの補題というものが保証している
  • 後半の議論は疲れたのでフォローできていない

次元によらず確率分布の距離を測る方法としてOptimal transportが使われるという話は聞いていたが、Earth mover's distanceと直接関係があるとは知らなかった。EMDはかなりプリミティブな概念だが、プリミティブなものを軽視してはいけないという反省が生じた。この手法だと、確率分布の比較は出来るが、時系列のような確率分布を並べたものを生成する規則があるとして、その規則そのものの距離はそのままでは測れないという制限がありそう。