yoriyuki is a user on mathtod.online. You can follow them or interact with them if you have an account anywhere in the fediverse. If you don't, you can sign up here.

形式検証の国際会議FM2018で発表予定の共著論文をarXivにポストしました。制御系の検証を強化学習を用いて行うことで、既存手法に比べ少ないシミュレーション回数でより確実に反例を見つけられることを示しました。

強化学習の実装にはChainerRLを用いています。

arxiv.org/abs/1805.00200

yoriyuki @yoriyuki

この論文、数学的には

\[ \max(x_1, \ldots, x_n) \sim \log \left [ 1 - n + \sum_{i = 1}^n e^{x_i} \right] \]

という近似がすべてです。

· Web · 4 · 2