本番運用でまずやること

- 正解率のデータ化1
- 名前で画像検索し、face.comに登録してない画像で数十枚テスト
- テストデータは固定するのが理想、でも管理の手間が悩む
- 正解率のデータ化2
- 人物ごとに「あってる!」が押された数を集計・ランキング
- 不正解数が分からないのが悩ましい
- 名前を入力した場合は、不正解数の一部と考えることはできる
- 入力された名前が正しいと仮定して、判別済み画像の「どれでもない」数を合計する?多く検索された画像のスコアが高くなるだけかな
メモ

方針
ユーザ入力は必ずDBに保存する
学習に回すかは場合による
意見が分かれてる画像をどう扱うか?
有名な娘は学習データがふらつかないように
マイナーな娘は積極的に学習する
新規登録の娘は必ず登録
名前が増えるぶんには害はない、と思う
優先順位
まずは学習データを増やすのを最優先
画像の新規登録
未判定画像画面
知ってる!→名前登録のフロー
名前の入力補完は重要
悩む
「当たってる!」ボタン
もう判定できる画像を未判定に出さない効果がある
とはいえ、押さない人も多そう
recognizeできた場合は未判定に出さない?
検索結果画面
アクションなし
未登録の画像なら新規登録
recognizeできた場合は未判定に出さない?
関連づけするには、データの信頼性が足りない
未登録の画像で「当たってる!」ボタンが押された
画像を新規登録し、その娘(A)に関連づける
画像の「Aの娘だ!」カウント+1
ある条件で学習する(例: ○○の娘だ!カウントが10以上・その娘のtraining_setが10未満)
未登録の画像で「どれでもない」ボタンが押された
画像を新規登録
登録済みの画像で「当たってる!」ボタンが押された
学習している娘と一致(A)したら
画像の「Aの娘だ!」カウント+1
学習している娘と違う(B)なら
その娘を画像に追加で関連づけ(学習はしない)
画像の「Bの娘だ!」カウント+1
(100%以外の結果も出るようだ)
登録済みの画像で「どれでもない」ボタンが押された
「違ってる!」カウント+1?
未判定の画像の「知ってる!」ボタン
画像を新規登録する
未登録の娘なら
関連づけし、学習する
登録済みの娘なら
関連づける
ある条件で学習する(例: その娘のtraining_setが10未満)
判定済みの画像の「違ってる!」ボタン
画像の「違ってる!」カウント+1
学習済みなら、ある条件で学習を取り消す(例: カウント5以上)
未判定画像画面
学習に使われてなくても、関連づけ済みなら表示しない
有名な娘はどんどん非表示にした方が、新規の娘の学習効率がよさそう
ふぁぼり機能
かわいい!と思った娘を保存し、あとで登録されたか確認できる
星が多い娘は優先的に表示
判定済み画像画面
学習済みなら、その名前で表示
未学習で、意見が割れてる場合は、誰の名前で表示する?
とりあえず、一番「○○の娘だ!」カウントが多い娘かな
学習効果を考えると、学習済み画像を優先?
「合ってる」「違ってる」の票数が割れてる画像を優先?
同じ娘ばかり出るようなら、補正を入れよう
意見が割れてる画像画面?
必要?