情報数物研究会
2021年度 情報数物研究会
日程・場所 | 2022年2月10日木曜16:00-17:30
オンライン |
講演者 | 荒井俊太氏(東北大学大学院情報科学研究科情報基礎科学>専攻 |
講演タイトル | 量子パーセプトロンの統計力学的解析 |
アブストラクト |
量子技術を利用した様々なハードウェアの発展により、近年量子機械学習が注目を集めている。特に量子ゲート型量子コンピュータで実行可能な量子回路を利用した量子機械学習モデルが期待されている。
本講演では、量子機械学習モデルの中でも量子パーセプトロンと呼ばれるモデルについての統計力学を用いた典型性能評価について紹介する。
様々な量子パーセプトロンが考案されているが、今回は先行研究[1]で扱われているような量子パーセプトロンを拡張したモデルについての結果を主に紹介し、
他の量子パーセプトロンモデル[2]の結果と比較しながら、モデルに対する量子揺らぎの影響などについて議論していく予定である。
[1] A.Gratsea, V.Kasper and M.Lewenstein, arXiv.2111.08414 (2021) [2] S.Arai, M.Ohzeki and K.Tanaka, J. Phys. Soc. Jpn. 90, 074002 (2021) |
日程・場所 | 2022年1月18日火曜日16:00-17:30
オンライン |
講演者 | 髙橋昂氏(東京大学大学院理学系研究科) |
講演タイトル | 疑似ラベルに基づく半教師あり学習の統計力学的解析 |
アブストラクト |
取得データの一部にしかラベルが付与されていない状況で分類モデルを学習する問題は半教師あり学習と呼ばれる.ここでは,半教師あり学習の具体的なアプローチとして,ラベルありデータで学習したモデルによってラベルなしデータ点に対して擬似的なラベルを付与し,その疑似ラベルを真のラベルであるかのようにみなして教師あり学習の要領でラベル付きデータとラベルなしデータの両方を組み合わせて学習するアルゴリズムを考える.これは単純で,かつ予測性能をしばしば実際に改善することからポピュラーな半教師あり学習の方法であるが,その有用性は経験的なものに偏っている.講演では疑似ラベルを用いた半教師あり学習の平均場モデルを統計力学的に解析し,その有用性を定量的に解析した結果を紹介する.
|
日程・場所 | 2021年10月21日木曜日16:00-17:30
オンライン |
講演者 | 吉野元氏(大阪大学サイバーメディアセンター) |
講演タイトル | 深層パーセプトロンネットワークにおける学習の統計力学 |
アブストラクト |
深層ニューラルネットワーク(DNN)を用いた機械学習は身近なものとなったが、そのメカニズムには不明なことが多く、ブラックボックスのまま使われている面が無視できない。我々はランダム系の統計力学、情報統計力学の方法を用いてDNNによる学習を解析することを試みている。その最初のスッテプとして、E. Gardnerらによる単純パーセプトロンを用いた学習のレプリカ理論[1]を、多層に拡張した[2,3]。ネットワークの深さをL, 幅をN,学習データの数をMとし、比α=M/Nを固定してNおよびM無限大の極限を考える。これを用いて(i)ランダムな訓練データによる学習、(ii)ランダムな教師を用いた教師ー生徒シナリオでの学習を解析した。その結果、学習の効果がネットワーク内部で不均一で、ネットワークの両端付近でもっとも解空間が狭くなり、逆に中央付近で「遊び」を多く残すことがわかった。(i),また(ii)でもベイズ最適性を崩した場合にはレプリカ対称性の破れ(RSB)が起こるが、その階層性もネットワークの中央部に向かって段階的に単純化する。本セミナーではこれらについて、一部数値実験の結果も交えて議論する。
[1] E. Gardner, J. Phys. A: Math. Gen. 21, 257 (1988), E. Gardner and B. Derrida, J. Phys. A: Math. Gen. 22, 1983 (1989) [2] H. Yoshino, SciPost Physics Core2, 005(2020) [3] 吉野 元 「深層ニューラルネットワークの解剖 - 統計力学によるアプローチ」日本物理学会誌76巻9号(2021年9月号)「最近の研究から」 |
日程・場所 | 2021年9月27日月曜日16:00-17:30
オンライン |
講演者 | 西川宜彦氏(東北大学大学院情報科学研究科情報基礎科学専攻) |
講演タイトル | Lattice Glass Model in Three Spatial Dimensions |
アブストラクト |
Supercooled liquids and glasses are easily obtained when liquids are cooled so rapidly that a first-order liquid-crystal phase transition is avoided. Even though glasses such as window glasses around us are hard and rigid in the conventional sense, they are believed to be liquids in thermodynamics, meaning that they eventually flow in the long time limit [1] On the other hand, in “fragile” super-cooled liquids showing super-Arrhenius growth in the relaxation time and viscosity, a possibility of ideal (or thermodynamic) glass transition deep inside the supercooled-liquid branch was suggested by Kauzmann in 1948 [2].
To study the possibility of thermodynamic glass transition numerically, we need to equilibrate models of fragile supercooled liquids down to very low temperature and see directly what happens there. However, due to the extremely long relaxation time and the lack of proper models that are stable enough against crystallization, we are still unable to reach low enough temperature in the supercooled-liquid branch by numerical simulations. In a recent paper [3], we proposed a three-dimensional lattice glass model on a simple cubic lattice that exhibits the typical dynamics observed in fragile supercooled liquids such as two-step relaxation, super-Arrhenius growth in the relaxation time, and dynamical heterogeneity. Using advanced Monte Carlo methods, we computed the thermodynamic properties deep inside the glassy temperature regime, well below the onset temperature of the slow dynamics. We also studied an effective free energy of glasses, the Franz–Parisi potential, as a function of the overlap between equilibrium and quenched configurations. The effective free energy indicates the existence of a first-order phase transition when a coupling field conjugate to the overlap is introduced, consistent with the mean-field, random first-order transition theory. In this seminar, I will discuss the model, and its glassy dynamics and thermodynamics, with a focus on its relevance in the literature of glass physics. [1] L. Berthier and G. Biroli, Rev. Mod. Phys. 83, 587 (2011) [2] A. W. Kauzmann, Chem. Rev. 43, 219 (1948) [3] Y. Nishikawa and K. Hukushima, Phys. Rev. Lett., 125, 065501 (2020) |