小红花·文摘

本研究提出了马特ryoshka重排序器架构，旨在解决大语言模型在计算带宽限制下的灵活调整问题。该架构支持用户自定义模型层和序列长度，并通过级联自蒸馏和分解补偿机制显著提升重排序性能，展现出良好的适应性和效果保持。