Web Bench - A new way to compare AI Browser Agents Web Benchは、Webブラウジングエージェントを評価するための新しいデータセットです。 452の異なるWebサイトで5,750のタスクで構成され、2,454のタスクがオープンソース化されています。 Anthropic Sonnet 3.7 CUAが現在のSOTAであり、詳細な結果が公開されています。
teachyourselfmath - club バンガロールで始まった数学クラブに関する情報です。 大学卒業後、数学の学習が孤独なものになっていた筆者が、共同学習の精神を取り戻すために立ち上げました。 過去のミートアップの問題と解答が共有されており、連絡先も記載されています。