All Articles

Articles

Latest First Most Viewed Alphabetical

All Conference (266) Law Review (314) Academic (4957) Think Tank (60) News (791) Journal (139) Technology & AI (4) Business & Strategy (1) Finance & Economics (2) Legal & Compliance (1) Innovation & Research (0) International Affairs (2) Cybersecurity (2) Healthcare & Biotech (2)

Academic · 1 min

TurkicNLP: An NLP Toolkit for Turkic Languages

arXiv:2602.19174v1 Announce Type: new Abstract: Natural language processing for the Turkic language family, spoken by over 200 million people across Eurasia, remains fragmented, with most …

Sherzod Hakimov

19 views Feb 25

Academic · 1 min

Next Reply Prediction X Dataset: Linguistic Discrepancies in Naively Generated Content

arXiv:2602.19177v1 Announce Type: new Abstract: The increasing use of Large Language Models (LLMs) as proxies for human participants in social science research presents a promising, …

Simon M\"unker, Nils Schwager, Kai Kugler, Michael Heseltine, Achim Rettinger

18 views Feb 25

Academic · 1 min

Retrieval Augmented Enhanced Dual Co-Attention Framework for Target Aware Multimodal Bengali Hateful Meme Detection

arXiv:2602.19212v1 Announce Type: new Abstract: Hateful content on social media increasingly appears as multimodal memes that combine images and text to convey harmful narratives. In …

Raihan Tanvir, Md. Golam Rabiul Alam

20 views Feb 25

Academic · 1 min

Learning to Reason for Multi-Step Retrieval of Personal Context in Personalized Question Answering

arXiv:2602.19317v1 Announce Type: new Abstract: Personalization in Question Answering (QA) requires answers that are both accurate and aligned with users' background, preferences, and historical context. …

Maryam Amirizaniani, Alireza Salemi, Hamed Zamani

22 views Feb 25

Academic · 1 min

Anatomy of Agentic Memory: Taxonomy and Empirical Analysis of Evaluation and System Limitations

arXiv:2602.19320v1 Announce Type: new Abstract: Agentic memory systems enable large language model (LLM) agents to maintain state across long interactions, supporting long-horizon reasoning and personalization …

Dongming Jiang, Yi Li, Songtao Wei, Jinxin Yang, Ayushi Kishore, Alysa Zhao, Dingyi Kang, Xu Hu, Feng Chen, Qiannan Li, Bingzhe Li

29 views Feb 25

Academic · 1 min

PerSoMed: A Large-Scale Balanced Dataset for Persian Social Media Text Classification

arXiv:2602.19333v1 Announce Type: new Abstract: This research introduces the first large-scale, well-balanced Persian social media text classification dataset, specifically designed to address the lack of …

Isun Chehreh, Ebrahim Ansari

45 views Feb 25

Academic · 1 min

Pyramid MoA: A Probabilistic Framework for Cost-Optimized Anytime Inference

arXiv:2602.19509v1 Announce Type: new Abstract: Large Language Models (LLMs) face a persistent trade-off between inference cost and reasoning capability. While "Oracle" models (e.g., Llama-3-70B) achieve …

Arindam Khaled

18 views Feb 25

Academic · 1 min

How to Train Your Deep Research Agent? Prompt, Reward, and Policy Optimization in Search-R1

arXiv:2602.19526v1 Announce Type: new Abstract: Deep Research agents tackle knowledge-intensive tasks through multi-round retrieval and decision-oriented generation. While reinforcement learning (RL) has been shown to …

Yinuo Xu, Shuo Lu, Jianjie Cheng, Meng Wang, Qianlong Xie, Xingxing Wang, Ran He, Jian Liang

19 views Feb 25

Academic · 1 min

Hyper-KGGen: A Skill-Driven Knowledge Extractor for High-Quality Knowledge Hypergraph Generation

arXiv:2602.19543v1 Announce Type: new Abstract: Knowledge hypergraphs surpass traditional binary knowledge graphs by encapsulating complex $n$-ary atomic facts, providing a more comprehensive paradigm for semantic …

Rizhuo Huang, Yifan Feng, Rundong Xue, Shihui Ying, Jun-Hai Yong, Chuan Shi, Shaoyi Du, Yue Gao

13 views Feb 25

Academic · 1 min

Beyond a Single Extractor: Re-thinking HTML-to-Text Extraction for LLM Pretraining

arXiv:2602.19548v1 Announce Type: new Abstract: One of the first pre-processing steps for constructing web-scale LLM pretraining datasets involves extracting text from HTML. Despite the immense …

Jeffrey Li, Josh Gardner, Doug Kang, Fangping Shi, Karanjeet Singh, Chun-Liang Li, Herumb Shandilya, David Hall, Oncel Tuzel, Percy Liang, Ludwig Schmidt, Hadi Pour Ansari, Fartash Faghri

23 views Feb 25

Academic · 1 min

Sculpting the Vector Space: Towards Efficient Multi-Vector Visual Document Retrieval via Prune-then-Merge Framework

arXiv:2602.19549v1 Announce Type: new Abstract: Visual Document Retrieval (VDR), which aims to retrieve relevant pages within vast corpora of visually-rich documents, is of significance in …

Yibo Yan, Mingdong Ou, Yi Cao, Xin Zou, Jiahao Huo, Shuliang Liu, James Kwok, Xuming Hu

18 views Feb 25

Academic · 1 min

Temporal-Aware Heterogeneous Graph Reasoning with Multi-View Fusion for Temporal Question Answering

arXiv:2602.19569v1 Announce Type: new Abstract: Question Answering over Temporal Knowledge Graphs (TKGQA) has attracted growing interest for handling time-sensitive queries. However, existing methods still struggle …

Wuzhenghong Wen, Bowen Zhou, Jinwen Huang, Xianjie Wu, Yuwei Sun, Su Pan, Liang Li, Jianting Liu

19 views Feb 25

← Previous

478 479 480 481 482

Articles

TurkicNLP: An NLP Toolkit for Turkic Languages

Next Reply Prediction X Dataset: Linguistic Discrepancies in Naively Generated Content

Retrieval Augmented Enhanced Dual Co-Attention Framework for Target Aware Multimodal Bengali Hateful Meme Detection

Learning to Reason for Multi-Step Retrieval of Personal Context in Personalized Question Answering

Anatomy of Agentic Memory: Taxonomy and Empirical Analysis of Evaluation and System Limitations

PerSoMed: A Large-Scale Balanced Dataset for Persian Social Media Text Classification

Pyramid MoA: A Probabilistic Framework for Cost-Optimized Anytime Inference

How to Train Your Deep Research Agent? Prompt, Reward, and Policy Optimization in Search-R1

Hyper-KGGen: A Skill-Driven Knowledge Extractor for High-Quality Knowledge Hypergraph Generation

Beyond a Single Extractor: Re-thinking HTML-to-Text Extraction for LLM Pretraining

Sculpting the Vector Space: Towards Efficient Multi-Vector Visual Document Retrieval via Prune-then-Merge Framework

Temporal-Aware Heterogeneous Graph Reasoning with Multi-View Fusion for Temporal Question Answering

JCG, PC

HSOLLC Co., Ltd.