Academic

Latest First Most Viewed Alphabetical

All Conference (266) Law Review (314) Academic (4957) Think Tank (60) News (791) Journal (139) Technology & AI (4) Business & Strategy (1) Finance & Economics (2) Legal & Compliance (1) Innovation & Research (0) International Affairs (2) Cybersecurity (2) Healthcare & Biotech (2)

Academic · 1 min

Khatri-Rao Clustering for Data Summarization

arXiv:2603.06602v1 Announce Type: new Abstract: As datasets continue to grow in size and complexity, finding succinct yet accurate data summaries poses a key challenge. Centroid-based …

Martino Ciaperoni, Collin Leiber, Aristides Gionis, Heikki Mannila

37 views Mar 10

Academic · 1 min

Scale Dependent Data Duplication

arXiv:2603.06603v1 Announce Type: new Abstract: Data duplication during pretraining can degrade generalization and lead to memorization, motivating aggressive deduplication pipelines. However, at web scale, it …

Joshua Kazdan, Noam Levi, Rylan Schaeffer, Jessica Chudnovsky, Abhay Puri, Bo He, Mehmet Donmez, Sanmi Koyejo, David Donoho

33 views Mar 10

Academic · 1 min

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

arXiv:2603.06604v1 Announce Type: new Abstract: As large language models (LLMs) are increasingly deployed in critical decision-making systems, the lack of reliable methods to measure their …

Xie Xiaohu, Liu Xiaohu, Yao Benjamin

26 views Mar 10

Academic · 1 min

Structure-Aware Set Transformers: Temporal and Variable-Type Attention Biases for Asynchronous Clinical Time Series

arXiv:2603.06605v1 Announce Type: new Abstract: Electronic health records (EHR) are irregular, asynchronous multivariate time series. As time-series foundation models increasingly tokenize events rather than discretizing …

Joohyung Lee, Kwanhyung Lee, Changhun Kim, Eunho Yang

24 views Mar 10

Academic · 1 min

LegoNet: Memory Footprint Reduction Through Block Weight Clustering

arXiv:2603.06606v1 Announce Type: new Abstract: As the need for neural network-based applications to become more accurate and powerful grows, so too does their size and …

Joseph Bingham, Noah Green, Saman Zonouz

28 views Mar 10

Academic · 1 min

Valid Feature-Level Inference for Tabular Foundation Models via the Conditional Randomization Test

arXiv:2603.06609v1 Announce Type: new Abstract: Modern machine learning models are highly expressive but notoriously difficult to analyze statistically. In particular, while black-box predictors can achieve …

Mohamed Salem

23 views Mar 10

Academic · 1 min

CapTrack: Multifaceted Evaluation of Forgetting in LLM Post-Training

arXiv:2603.06610v1 Announce Type: new Abstract: Large language model (LLM) post-training enhances latent skills, unlocks value alignment, improves performance, and enables domain adaptation. Unfortunately, post-training is …

Lukas Thede, Stefan Winzeck, Zeynep Akata, Jonathan Richard Schwarz

33 views Mar 10

Academic · 1 min

Consensus is Not Verification: Why Crowd Wisdom Strategies Fail for LLM Truthfulness

arXiv:2603.06612v1 Announce Type: new Abstract: Pass@k and other methods of scaling inference compute can improve language model performance in domains with external verifiers, including mathematics …

Yegor Denisov-Blanch, Joshua Kazdan, Jessica Chudnovsky, Rylan Schaeffer, Sheng Guan, Soji Adeshina, Sanmi Koyejo

28 views Mar 10

Academic · 1 min

OptiRoulette Optimizer: A New Stochastic Meta-Optimizer for up to 5.3x Faster Convergence

arXiv:2603.06613v1 Announce Type: new Abstract: This paper presents OptiRoulette, a stochastic meta-optimizer that selects update rules during training instead of fixing a single optimizer. The …

Stamatis Mastromichalakis

37 views Mar 10

Academic · 1 min

Correlation Analysis of Generative Models

arXiv:2603.06614v1 Announce Type: new Abstract: Based on literature review about existing diffusion models and flow matching with a neural network to predict a predefined target …

Zhengguo Li, Chaobing Zheng, Wei Wang

36 views Mar 10

Academic · 1 min

Annealed Co-Generation: Disentangling Variables via Progressive Pairwise Modeling

arXiv:2603.06615v1 Announce Type: new Abstract: For multivariate co-generation in scientific applications, we advocate pairwise block rather than joint modeling of all variables. This design mitigates …

Hantao Zhang, Jieke Wu, Mingda Xu, Xiao Hu, Yingxuan You, Pascal Fua

36 views Mar 10

Academic · 1 min

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

arXiv:2603.06616v1 Announce Type: new Abstract: Efficiently routing queries to the optimal large language model (LLM) is crucial for optimizing the cost-performance trade-off in multi-model systems. …

Sai Hao, Hao Zeng, Hongxin Wei, Bingyi Jing

48 views Mar 10

← Previous

188 189 190 191 192

Academic

Khatri-Rao Clustering for Data Summarization

Scale Dependent Data Duplication

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

Structure-Aware Set Transformers: Temporal and Variable-Type Attention Biases for Asynchronous Clinical Time Series

LegoNet: Memory Footprint Reduction Through Block Weight Clustering

Valid Feature-Level Inference for Tabular Foundation Models via the Conditional Randomization Test

CapTrack: Multifaceted Evaluation of Forgetting in LLM Post-Training

Consensus is Not Verification: Why Crowd Wisdom Strategies Fail for LLM Truthfulness

OptiRoulette Optimizer: A New Stochastic Meta-Optimizer for up to 5.3x Faster Convergence

Correlation Analysis of Generative Models

Annealed Co-Generation: Disentangling Variables via Progressive Pairwise Modeling

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

JCG, PC

HSOLLC Co., Ltd.