7.3 'load_metrics' を 'evaluate.load' に更新する #49

skotani-db · 2025-01-05T09:41:17Z

7.3.1 ROUGE - ROUGEを算出するための実装
datasets ライブラリの変更に伴い、'load_metrics' が廃止されているため、
ImportError: cannot import name 'load_metric' from 'datasets' が発生します。
代替手段として 'evaluate' の使用が推奨されています。以下のように実装を更新してはどうでしょうか。違いとしては、以前の dataset ライブラリでの実装では Precision, Recall も計算されましたが、F値のみが返却される仕様となっておりました。

!pip install evaluate

import evaluate

def compute_rouge(
    # 省略

    # ROUGEメトリクスをロード
    rouge = evaluate.load("rouge")

    # 省略
    
    # ROUGEスコアを計算
    scores = rouge.compute(rouge_types=["rouge1", "rouge2", "rougeL"])

    # 文ごとに辞書で返ってくるのでそのままリターンする
    return scores

# ROUGEを算出した結果を表示する
rouge_results = {
    "生成文1": compute_rouge([pred_wakati1], [ref_wakati]),
    "生成文2": compute_rouge([pred_wakati2], [ref_wakati]),
    "生成文3": compute_rouge([pred_wakati3], [ref_wakati]),
}
df_list = [
    pd.DataFrame.from_dict(rouge_results[k], orient="index", columns=['fmeasure'])
    for k in rouge_results.keys()
]
display(pd.concat(df_list, keys=rouge_results.keys(), axis=1).T)

7.3.2 BLEU - BLEUを算出するための実装
同様に、BLEUの実装も evaluate を使用してはどうでしょうか

import evaluate

def compute_bleu(
    # 省略

    # BLEUメトリクスをロード
    bleu = evaluate.load("bleu")

    # 省略

Kosuke-Yamada mentioned this issue Jan 18, 2025

Modify chapter7 #52

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

7.3 'load_metrics' を 'evaluate.load' に更新する #49

7.3 'load_metrics' を 'evaluate.load' に更新する #49

skotani-db commented Jan 5, 2025

7.3 'load_metrics' を 'evaluate.load' に更新する #49

7.3 'load_metrics' を 'evaluate.load' に更新する #49

Comments

skotani-db commented Jan 5, 2025