https://mathtod.online/@waidotto/409847
y.さんのおかげで、gccでJuliaと同じ速さ、円周率モンテカルロをできるようになりました!
gcc で並列化を使わずに0.4秒台が出ました!
私が追試するときに使ったコードとコンパイルの仕方(Makefile)は次の場所にあります。
https://gist.github.com/genkuroki/67a5ab63a44ad88446f31db499f08d1c
findpi_dSFMT.c のコンパイルのためには
http://www.math.sci.hiroshima-u.ac.jp/~m-mat/MT/SFMT/index-jp.html
から dSFMT-src-2.2.3 をダウンロードして展開しておく必要があります。
#python #numpy
たぶん、Python + numpy のケースはもっと高速化できると思います。
私の現時点での知識と能力ではやり方が思い付かないのですが、原理的には Python の for ループを避けることと配列を避けることが同時にできれば確実に速くなるはず。