Academic

Academic · 1 min

Balanced Thinking: Improving Chain of Thought Training in Vision Language Models

arXiv:2603.18656v1 Announce Type: new Abstract: Multimodal reasoning in vision-language models (VLMs) typically relies on a two-stage process: supervised fine-tuning (SFT) and reinforcement learning (RL). In …

Shaked Perek, Ben Wiesel, Avihu Dekel, Nimrod Shabtay, Eli Schwartz

12 views Mar 20

Academic · 1 min

An Onto-Relational-Sophic Framework for Governing Synthetic Minds

arXiv:2603.18633v1 Announce Type: new Abstract: The rapid evolution of artificial intelligence, from task-specific systems to foundation models exhibiting broad, flexible competence across reasoning, creative synthesis, …

Huansheng Ning, Jianguo Ding

26 views Mar 20

Academic · 1 min

D-Mem: A Dual-Process Memory System for LLM Agents

arXiv:2603.18631v1 Announce Type: new Abstract: Driven by the development of persistent, self-adapting autonomous agents, equipping these systems with high-fidelity memory access for long-horizon reasoning has …

Zhixing You, Jiachen Yuan, Jason Cai

10 views Mar 20

Academic · 1 min

Agentic Flow Steering and Parallel Rollout Search for Spatially Grounded Text-to-Image Generation

arXiv:2603.18627v1 Announce Type: new Abstract: Precise Text-to-Image (T2I) generation has achieved great success but is hindered by the limited relational reasoning of static text encoders …

Ping Chen, Daoxuan Zhang, Xiangming Wang, Yungeng Liu, Haijin Zeng, Yongyong Chen

9 views Mar 20

Academic · 1 min

ZEBRAARENA: A Diagnostic Simulation Environment for Studying Reasoning-Action Coupling in Tool-Augmented LLMs

arXiv:2603.18614v1 Announce Type: new Abstract: Tool-augmented large language models (LLMs) must tightly couple multi-step reasoning with external actions, yet existing benchmarks often confound this interplay …

Wanjia Zhao, Ludwig Schmidt, James Zou, Vidhisha Balachandran, Lingjiao Chen

58 views Mar 20

Academic · 1 min

MedForge: Interpretable Medical Deepfake Detection via Forgery-aware Reasoning

arXiv:2603.18577v1 Announce Type: new Abstract: Text-guided image editors can now manipulate authentic medical scans with high fidelity, enabling lesion implantation/removal that threatens clinical trust and …

Zhihui Chen, Kai He, Qingyuan Lei, Bin Pu, Jian Zhang, Yuling Xu, Mengling Feng

11 views Mar 20

Academic · 1 min

Interplay: Training Independent Simulators for Reference-Free Conversational Recommendation

arXiv:2603.18573v1 Announce Type: new Abstract: Training conversational recommender systems (CRS) requires extensive dialogue data, which is challenging to collect at scale. To address this, researchers …

Jerome Ramos, Feng Xia, Xi Wang, Shubham Chatterjee, Xiao Fu, Hossein A. Rahmani, Aldo Lipani

13 views Mar 20

Academic · 1 min

CAPSUL: A Comprehensive Human Protein Benchmark for Subcellular Localization

arXiv:2603.18571v1 Announce Type: new Abstract: Subcellular localization is a crucial biological task for drug target identification and function annotation. Although it has been biologically realized …

Yicheng Hu, Xinyu Lin, Shulin Li, Wenjie Wang, Fengbin Zhu, Fuli Feng

56 views Mar 20

Academic · 1 min

Reasonably reasoning AI agents can avoid game-theoretic failures in zero-shot, provably

arXiv:2603.18563v1 Announce Type: new Abstract: AI agents are increasingly deployed in interactive economic environments characterized by repeated AI-AI interactions. Despite AI agents' advanced capabilities, empirical …

Enoch Hyunwook Kang

42 views Mar 20

Academic · 1 min

Correlation-Weighted Multi-Reward Optimization for Compositional Generation

arXiv:2603.18528v1 Announce Type: new Abstract: Text-to-image models produce images that align well with natural language prompts, but compositional generation has long been a central challenge. …

Jungmyung Wi, Hyunsoo Kim, Donghyun Kim

11 views Mar 20

Academic · 1 min

Expert Personas Improve LLM Alignment but Damage Accuracy: Bootstrapping Intent-Based Persona Routing with PRISM

arXiv:2603.18507v1 Announce Type: new Abstract: Persona prompting can steer LLM generation towards a domain-specific tone and pattern. This behavior enables use cases in multi-agent systems …

Zizhao Hu, Mohammad Rostami, Jesse Thomason

11 views Mar 20

Academic · 1 min

Cross-Domain Demo-to-Code via Neurosymbolic Counterfactual Reasoning

arXiv:2603.18495v1 Announce Type: new Abstract: Recent advances in Vision-Language Models (VLMs) have enabled video-instructed robotic programming, allowing agents to interpret video demonstrations and generate executable …

Jooyoung Kim, Wonje Choi, Younguk Song, Honguk Woo

16 views Mar 20

Balanced Thinking: Improving Chain of Thought Training in Vision Language Models

An Onto-Relational-Sophic Framework for Governing Synthetic Minds

D-Mem: A Dual-Process Memory System for LLM Agents

Agentic Flow Steering and Parallel Rollout Search for Spatially Grounded Text-to-Image Generation

ZEBRAARENA: A Diagnostic Simulation Environment for Studying Reasoning-Action Coupling in Tool-Augmented LLMs

MedForge: Interpretable Medical Deepfake Detection via Forgery-aware Reasoning

Interplay: Training Independent Simulators for Reference-Free Conversational Recommendation

CAPSUL: A Comprehensive Human Protein Benchmark for Subcellular Localization

Reasonably reasoning AI agents can avoid game-theoretic failures in zero-shot, provably

Correlation-Weighted Multi-Reward Optimization for Compositional Generation

Expert Personas Improve LLM Alignment but Damage Accuracy: Bootstrapping Intent-Based Persona Routing with PRISM

Cross-Domain Demo-to-Code via Neurosymbolic Counterfactual Reasoning

JCG, PC

HSOLLC Co., Ltd.