発表資料 - 甲南大学

ユーザ投稿型レシピサイトにおける
酷似レシピクラスタ提示手法の提案
☆花井俊介(甲南大学)
難波英嗣(広島市立大学)
灘本明代(甲南大学)
背景
2
背景
一般ユーザにとって有用でないレシピ
酷似したレシピ
特殊な食材,器具を
用いたレシピ
スパムレシピ
ほとんど手順が
書かれていないレシピ
3
レシピ検索のクエリ
インターネットでレシピを検索する際の検索ワード

「料理名」
65.8%
 「作りたい料理を決めた後」
例)ハンバーグ,カレー

「食材名」
75.1 %
例)鶏肉,なす

「調理方法」
料理レシピを探すタイミング
26.9%
 「作りたい料理を決める前」
22.2%
56.5%
例)焼き,蒸し
「食材名」をクエリとして検索を行っている
※マルハニチロホールディングス,「料理レシピに関する調査」,2013.
4
クエリによる検索結果の違い:
「料理名」で検索
クエリ:ロールキャベツ
「料理名」で検索を行っているため,その料理の作り方,
アレンジが存在しても気にならない
5
「食材名」での検索結果例
クエリ:鶏肉 AND キャベツ
目的:
酷似したレシピをクラスタリング
レシピ選択の負担を減らす
同じ料理の酷似したレシピが多数存在
その他のレシピを知りたい時に邪魔になる
6
酷似レシピの仮説

仮説1:タイトル中の料理名,調理法,食材名,
調味料の一致

仮説2:材料中に含まれる食材がほぼ一致

仮説3:味の決め手となる調味料の一致

仮説4:調理の流れが一致
7
酷似レシピ根拠抽出の調査
目的:酷似の判断箇所,酷似の根拠
被験者:日常的に料理をしている男女12名
方法
1. 同種類の料理のレシピを2つ1組として25組提示
提示したレシピ情報はタイトル,材料,手順とした
レシピの酷似の判断において、画像の有無は考慮されない※
2. 2つのレシピが酷似しているかを5段階評価
(「5:酷似している」~「1:酷似していない」)
3. 酷似の判断の根拠となった箇所(単語)を挙げる
※花井俊介,灘本明代,“食材名をクエリとしたレシピ検索における酷似レシピクラスタリング”,信学技報, 8
vol.114,no. 204,DE2014-31, pp. 47-52, 2014.
実験に用いたレシピ例
レシピ名
レシピ名
ふわふわオムライス
とろとろオムライス
豚しょうが焼
なすと豚肉のしょうが焼き
鶏肉のチンジャオロース
ムネ肉のチンジャオロース
ぷりぷりエビとザクザクキャベツの餃子
豆腐de カンタン♪ミートグラタン♪
エビぎょうざ
★簡単!ヘルシーな
*お豆腐のグラタン*
クラムチャウダー
あさりのクラムチャウダー
9
タイトル
材料
手順
10
調査結果
80%以上の人が「酷似している」「どちらかというと酷似している」と
答えたレシピ ⇒ 10件


仮説1:タイトル中の料理名,調理法,食材名,
調味料が完全に一致
仮説2:材料中に含まれる食材がほとんど一致
主食材の一致を考慮

仮説3:味の決め手となる調味料の一致
⇒一般的な調味料(塩,胡椒)はあまり考慮しない

仮説4:調理の流れが一致
⇒細かい手順の違いはあまり考慮しない
11
目的
仮説(1)~(3)を考慮し
ユーザ投稿型レシピサイトにおける
酷似レシピのクラスタリングを行う
酷似したレシピを閲覧する手間を省くことで,
ユーザのレシピ検索の際の負担を軽減
12
全体の流れ
「食材名」をクエリとして
レシピデータの取得
レシピに関する語の抽出
料理名・調理法を用いて
クラスタリング
食材・調味料を用いて
クラスタリング
クックパッドデータセットを使用
• Repeated Bisection※
-データ集合を繰り返し2分割し,
クラスタの中心を2つとして
K-means法を実行する手法
-クラスタ数:bayonを用いて
クラスタ数を取得
※花井 俊介, 灘本 明代,”酷似レシピ抽出のためのクラスタリング手法の提案”
第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014), F8-6,2014. 13
料理名,調理法名を用いたクラスタリング
鶏肉とキャベツ
を使った料理…
クラスタ2:玉ねぎ
料理名,調理法名ごとに提示
クラスタ1:鶏肉
クラスタ3:塩
クラスタ1:ロールキャベツ
クラスタ2:トマト煮
クラスタ3:炒め物
14
料理名,調理法名を用いたクラスタリング
•
•
•
•
検索
料理名
調理法名
食材名
調味料名
ユーザ
クラスタ1:ロールキャベツ
クラスタ2:トマト煮
クラスタ3:炒め物
料理名,調理法名ごとのクラスタを取得
15
全体の流れ
「食材名」をクエリとして
レシピデータの取得
レシピに関する語の抽出
料理名・調理法を用いて
クラスタリング
食材・調味料を用いて
クラスタリング
クックパッドデータセットを使用
• Repeated Bisection※
-データ集合を繰り返し2分割し,
クラスタの中心を2つとして
K-means法を実行する手法
-クラスタ数:bayonを用いて
クラスタ数を取得
※花井 俊介, 灘本 明代,”酷似レシピ抽出のためのクラスタリング手法の提案”
第6回データ工学と情報マネジメントに関するフォーラム(DEIM2014), F8-6,2014. 16
食材・調味料を用いたクラスタリング
クラスタ1:ロールキャベツ
定番!ロールキャベツ
クラスタ2:トマト煮
コンソメロールキャベツ
クラスタ3:炒め物
トマトベースのロールキャベツ
料理の特徴ごとのクラスタを取得
17
食材ごとの特徴量
同一料理での食材の一般性
各料理ごとに特徴となる食材は異なる
カレー
一般的な食材
• 牛肉
• じゃがいも
• 人参
一般的でない食材
• 納豆
• ちくわ
希少度は低い
希少度が高い
希少度の高い食材の方がその料理において特徴的
18
食材ごとの特徴量
ある料理における食材の出現頻度と出現位置から食材の
希少度を算出
S-RF-IIF
i :食材名
m :ある料理のレシピ数
Rm:ある料理m のレシピ数
Ri,t,m:ある料理m のタイトル中に食材i
が出現するレシピ数
Ri,t,m:ある料理m の食材レシピ中に
食材i が出現するレシピ数
α:タイトルの重み
β;食材の重み
19
食材名ごとの特徴量
クエリ:「鶏肉 AND じゃがいも」
20
単語の出現場所の適切な重みの決定
タイトルに含まれる単語
>
材料中に含まれる単語
単語の出現場所によって重要度が異なる
材料中に出現する単語の重みを0.1 から1 まで0.1 刻みで
変化させクラスタリング
重みごとに適合率,再現率,F値を求め適切な重みを決定
21
単語の出現場所の適切な重みの決定
データセット:「豚肉 AND なす」の
「炒め物」のクラスタ
正解データ:人手にて選出

適合率,再現率,F値
共に0.5のとき最大
22
システムフロー
クエリを用いたレシピリストを取得
クエリ
料理名・調理法
料理名・調理法名・食材名・
調味料名を取得
料理名・調理法を用いて
クラスタリング
レシピDB
料理名・食材
DB
1段階目の
クラスタリング
(Repeated Bisection)
ユーザ
料理名・調理法を選択
食材のS-RF-IIF値を算出
酷似レシピの提示
S-RF-IIF値と単語の出現場所の
重みを用いてクラスタリング
システム
2段階目の
クラスタリング
(Repeated Bisection)
23
プロトタイプシステム
24
プロトタイプシステム
25
実験条件

データセット
クエリ: (Cookpadのレシピデータを使用)
 「豚肉 AND なす」
5,885件
 「豚肉 AND たまねぎ」
28,525件
 「豚肉 AND 大根」
8,446件
 「鶏肉 AND じゃがいも」
9,147件
 「アボカド AND トマト」
5,284件

クラスタリング手法
Repeated Bisection:
-データ集合を繰り返し2分割し,クラスタの中心を2つとして
K-means法を実行する手法
-クラスタ数:bayonを用いてクラスタ数を取得
26
システムフロー
クエリを用いたレシピリストを取得
クエリ
料理名・調理法
料理名・調理法名・食材名・
調味料名を取得
料理名・調理法を用いて
クラスタリング
レシピDB
料理名・食材
DB
1段階目の
クラスタリング
(Repeated Bisection)
ユーザ
料理名・調理法を選択
食材のS-RF-IIF値を算出
酷似レシピの提示
S-RF-IIF値と単語の出現場所の
重みを用いてクラスタリング
システム
2段階目の
クラスタリング
(Repeated Bisection)
27
料理名・調理法名を用いたクラスタ例
クエリ:「豚肉 AND なす」
クエリ:「豚肉 AND たまねぎ」 クエリ:「豚肉 AND 大根」
クラスタ数:135
クラスタ数:146
クラスタ数:230
なす味噌炒め
夏野菜たっぷりカレー
大根とひき肉の煮物☆
なすのみそ炒め
和風ツナ・カレー
豚の煮物
ナスとお肉の
オイスターソース炒め
豚肉とリンゴのカレー風味
豚肉と根菜の中華風煮物
豚こまとなすのトロ旨炒め
はなびし草のトロトロ卵の
ドライカレー
大根の煮物☆圧力鍋使用♪
簡単♪豚バラで
コチュジャン炒め
大きめ野菜のポークカレー
大根のあっさり煮物
28
料理名・調理法名を用いたクラスタ例
クエリ:「鶏肉 AND じゃがいも」
クエリ:「アボカド AND トマト」
クラスタ数:142
クラスタ数:98
鶏つくね入りトマトシチュー
マグロとアボカドのサラダ
濃くと甘みたっぷりチキンの
トマトシチュー
ツナとアボガドのサラダ
チキンと野菜のシチュー
アボガドとモッツァレラサラダ
バジル風味
豆乳クリームシチュー
アボカドとツナのサラダ
クリームシチュー
アボガドとクリームチーズの
和風サラダ
29
システムフロー
クエリを用いたレシピリストを取得
クエリ
料理名・調理法
ユーザ
料理名・調理法名・食材名・
調味料名を取得
料理名・調理法を用いて
クラスタリング
レシピDB
料理名・食材
DB
1段階目の
クラスタリング
料理名・調理法を選択
食材のS-RF-IIF値を算出
酷似レシピの提示
S-RF-IIF値と単語の出現場所の
重みを用いてクラスタリング
システム
2段階目の
クラスタリング
30
食材名・調味料名を用いたクラスタ例 – 正例
クエリ:「豚肉 AND なす」
クエリ:「豚肉 AND たまねぎ」 クエリ:「アボカド AND トマト」
クラスタ数:135
クラスタ数:230
クラスタ数:98
★豚肉&なすのコチュジャ
ン炒め★
★とろっとろ★
豚なんこつのカレー
マグロとアボカドのサラダ
豚肉とナスのトロトロ炒め
超安!豚バラ軟骨の
美味カレー
アボカドまぐろサラダ
なすと豚肉の
コチュジャン炒め
我が家の絶品!豚軟骨カレー
まぐろとトマトとアボカド
のサラダ
豚とナスのこってり炒め
なんこつと蓮根の
美味しいカレー
お野菜ごろごろ♪マグロと
アボカドのサラダ
簡単♪豚バラで
コチュジャン炒め
コラーゲンたっぶり☆
豚なんこつカレー
わさび醤油で
【マグロ&アボガドのサラダ】
31
食材名・調味料名を用いたクラスタ例 - 負例
クエリ:「豚肉 AND 大根」
クエリ:「鶏肉 AND じゃがいも」
クラスタ数:146
クラスタ数:142
圧力鍋で大根と塩コンブの
簡単煮物
手作りホワイトソースで
温かシチュー♪
聖護院大根と昆布の煮物
チキンシチュー
圧力鍋で簡単!豚肉と
大根の煮物
豆乳使用のシチュー
大根美味しい豚と
ひろうすの煮もの
給食風クリームシチュー
大根と厚揚げの煮物
チーズ☆豆乳シチュー☆
32
クラスタごとの適合率の分散
33
まとめと今後の課題
レシピのページ構造,レシピに出現する重要な語に着目し,
2段階のクラスタリングを行うことで,酷似レシピを抽出する手法を提案した
酷似したレシピを閲覧する手間を省くことで,
ユーザの負担を軽減できる
今後の課題
1. 主食材の考慮
2. その料理の典型的な食材の除外
3. 食材分量の考慮
34
35