Вопросы

Почему потеря оценки увеличивается при обучении модели NER трансформаторов huggingface?

При обучении модели huggingface transformers NER в соответствии с документацией потеря оценки увеличивается через несколько эпох, но другие оценки (точность, точность, отзывчивость, f1) постоянно улучшаются. Поведение кажется неожиданным, есть ли простое объяснение этому эффекту? Может ли это зависеть от предоставленных данных?

model = TokenClassificationModel.from_pretrained('roberta-base', num_labels=len(tag_values))


model.train()
model.zero_grad()

   for epoch in range(epochs):
      for batch in range(batches):
         -- train --
         ...

      train_loss = model.evaluate(train_data)
      validation_loss = model.evaluate(validation_data)



Это просто указывало на переоснащение, очень распространенное явление.   —  person Moritz Blum    schedule 12.10.2020

Но не должны ли тогда и другие оценки также ухудшиться или, по крайней мере, остаться неизменными? Они значительно улучшаются ….   —  person Moritz Blum    schedule 12.10.2020

Не могли бы вы использовать один и тот же масштаб оси для каждой диаграммы? Первая диаграмма имеет шаг 0,1, а все остальные диаграммы — 0,2 шага.   —  person Moritz Blum    schedule 12.10.2020

Читать:
Pycharm не распознает установку Django

Вы придумали какой-нибудь способ решения этой проблемы? Имею дело с чем-то похожим на моей модели трансформаторов   —  person Moritz Blum    schedule 04.06.2021

К сожалению нет.   —  person Moritz Blum    schedule 07.06.2021

Похожие записи

присвоение значения индексу массива возвращает SIGSEGV; ошибка сегментации. | c

admin

Скомпилированный проект с файлами .lib, но когда я запускаю, Windows жалуется, что dll не найдена

admin

Не удается установить пакет numpy в pycharm

admin

Ошибка при установке пакета Gurobi Julia

admin

Показывать только те товары, которые есть в наличии, на странице одного товара WooCommerce

admin

Управление планом тестирования TFS в отношении новой итерации

admin