Re-FORC: Adaptive Reward Prediction for Efficient Chain-of-Thought Reasoning

February 22, 2026

Reading time: 1 minute

...

📝 Original Info

Title: Re-FORC: Adaptive Reward Prediction for Efficient Chain-of-Thought Reasoning
ArXiv ID: 2511.02130
Date: 2025-11-03
Authors: 정보가 제공되지 않음

📝 Abstract

None

💡 Deep Analysis

📄 Full Content

📄 Read Full PDF on ArXiv

📸 Image Gallery

early_stopping_1.7B_Minerva_MATH500_AMC2024_AIME2024_AIME2025.png

early_stopping_4B_Minerva_MATH500_AMC2024_AIME2024_AIME2025.png

early_stopping_8B_Minerva_MATH500_AMC2024_AIME2024_AIME2025.png

token_usage_1.7B_Minerva_MATH500_AMC2024_AIME2024_AIME2025.png

token_usage_4B_Minerva_MATH500_AMC2024_AIME2024_AIME2025.png

token_usage_8B_Minerva_MATH500_AMC2024_AIME2024_AIME2025.png

Reference

This content is AI-processed based on open access ArXiv data.

Web Analytics