This platform requires JavaScript for full functionality. Please enable JavaScript in your browser settings.

Quality follows upgrading

Tianlong Wang, Pinqiao Wang, Weili Shi, Sheng li

Articles by Tianlong Wang, Pinqiao Wang, Weili Shi, Sheng li

Academic · 1 min

ItinBench: Benchmarking Planning Across Multiple Cognitive Dimensions with Large Language Models

arXiv:2603.19515v1 Announce Type: new Abstract: Large language models (LLMs) with advanced cognitive capabilities are emerging as agents for various reasoning and planning tasks. Traditional evaluations …

21 views Mar 23

Tianlong Wang, Pinqiao Wang, Weili Shi, Sheng li

Articles by Tianlong Wang, Pinqiao Wang, Weili Shi, Sheng li

ItinBench: Benchmarking Planning Across Multiple Cognitive Dimensions with Large Language Models

JCG, PC

HSOLLC Co., Ltd.