Salvato in:
| Autori principali: | Chen, Xuetian, Li, Hangcheng, Liang, Jiaqing, Jiang, Sihang, Yang, Deqing |
|---|---|
| Natura: | Preprint |
| Pubblicazione: |
2024
|
| Soggetti: | |
| Accesso online: | https://arxiv.org/abs/2410.19461 |
| Tags: |
Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
Documenti analoghi
Reason from Fallacy: Enhancing Large Language Models' Logical Reasoning through Logical Fallacy Understanding
di: Li, Yanda, et al.
Pubblicazione: (2024)
di: Li, Yanda, et al.
Pubblicazione: (2024)
RLAP: A Reinforcement Learning Enhanced Adaptive Planning Framework for Multi-step NLP Task Solving
di: Ding, Zepeng, et al.
Pubblicazione: (2025)
di: Ding, Zepeng, et al.
Pubblicazione: (2025)
Enhancing Quantitative Reasoning Skills of Large Language Models through Dimension Perception
di: Huang, Yuncheng, et al.
Pubblicazione: (2023)
di: Huang, Yuncheng, et al.
Pubblicazione: (2023)
GUI-ARP: Enhancing Grounding with Adaptive Region Perception for GUI Agents
di: Ye, Xianhang, et al.
Pubblicazione: (2025)
di: Ye, Xianhang, et al.
Pubblicazione: (2025)
ToNER: Type-oriented Named Entity Recognition with Generative Language Model
di: Jiang, Guochao, et al.
Pubblicazione: (2024)
di: Jiang, Guochao, et al.
Pubblicazione: (2024)
PEMUTA: Pedagogically-Enriched Multi-Granular Undergraduate Thesis Assessment
di: Zhang, Jialu, et al.
Pubblicazione: (2025)
di: Zhang, Jialu, et al.
Pubblicazione: (2025)
Enhancing Visual Grounding for GUI Agents via Self-Evolutionary Reinforcement Learning
di: Yuan, Xinbin, et al.
Pubblicazione: (2025)
di: Yuan, Xinbin, et al.
Pubblicazione: (2025)
SED: Self-Evaluation Decoding Enhances Large Language Models for Better Generation
di: Luo, Ziqin, et al.
Pubblicazione: (2024)
di: Luo, Ziqin, et al.
Pubblicazione: (2024)
Adaptive Reinforcement Learning Planning: Harnessing Large Language Models for Complex Information Extraction
di: Ding, Zepeng, et al.
Pubblicazione: (2024)
di: Ding, Zepeng, et al.
Pubblicazione: (2024)
ANALOGYKB: Unlocking Analogical Reasoning of Language Models with A Million-scale Knowledge Base
di: Yuan, Siyu, et al.
Pubblicazione: (2023)
di: Yuan, Siyu, et al.
Pubblicazione: (2023)
CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs
di: Zhang, Jinghao, et al.
Pubblicazione: (2025)
di: Zhang, Jinghao, et al.
Pubblicazione: (2025)
Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization
di: Wang, Dixuan, et al.
Pubblicazione: (2024)
di: Wang, Dixuan, et al.
Pubblicazione: (2024)
Skeletons Matter: Dynamic Data Augmentation for Text-to-Query
di: Ji, Yuchen, et al.
Pubblicazione: (2025)
di: Ji, Yuchen, et al.
Pubblicazione: (2025)
AdaZoom-GUI: Adaptive Zoom-based GUI Grounding with Instruction Refinement
di: Pei, Siqi, et al.
Pubblicazione: (2026)
di: Pei, Siqi, et al.
Pubblicazione: (2026)
UI-Ins: Enhancing GUI Grounding with Multi-Perspective Instruction-as-Reasoning
di: Chen, Liangyu, et al.
Pubblicazione: (2025)
di: Chen, Liangyu, et al.
Pubblicazione: (2025)
GUI-Eyes: Tool-Augmented Perception for Visual Grounding in GUI Agents
di: Chen, Chen, et al.
Pubblicazione: (2026)
di: Chen, Chen, et al.
Pubblicazione: (2026)
Past Meets Present: Creating Historical Analogy with Large Language Models
di: Li, Nianqi, et al.
Pubblicazione: (2024)
di: Li, Nianqi, et al.
Pubblicazione: (2024)
Aria-UI: Visual Grounding for GUI Instructions
di: Yang, Yuhao, et al.
Pubblicazione: (2024)
di: Yang, Yuhao, et al.
Pubblicazione: (2024)
DRS-GUI: Dynamic Region Search for Training-Free GUI Grounding
di: Liu, Yichao, et al.
Pubblicazione: (2026)
di: Liu, Yichao, et al.
Pubblicazione: (2026)
MEGA-GUI: Multi-stage Enhanced Grounding Agents for GUI Elements
di: Kwak, SeokJoo, et al.
Pubblicazione: (2025)
di: Kwak, SeokJoo, et al.
Pubblicazione: (2025)
MPR-GUI: Benchmarking and Enhancing Multilingual Perception and Reasoning in GUI Agents
di: Chen, Ruihan, et al.
Pubblicazione: (2025)
di: Chen, Ruihan, et al.
Pubblicazione: (2025)
GUI-Actor: Coordinate-Free Visual Grounding for GUI Agents
di: Wu, Qianhui, et al.
Pubblicazione: (2025)
di: Wu, Qianhui, et al.
Pubblicazione: (2025)
\textsc{GUI-Spotlight}: Adaptive Iterative Focus Refinement for Enhanced GUI Visual Grounding
di: Lei, Bin, et al.
Pubblicazione: (2025)
di: Lei, Bin, et al.
Pubblicazione: (2025)
MP-GUI: Modality Perception with MLLMs for GUI Understanding
di: Wang, Ziwei, et al.
Pubblicazione: (2025)
di: Wang, Ziwei, et al.
Pubblicazione: (2025)
ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation
di: Hou, Hongru, et al.
Pubblicazione: (2026)
di: Hou, Hongru, et al.
Pubblicazione: (2026)
InfiGUI-G1: Advancing GUI Grounding with Adaptive Exploration Policy Optimization
di: Liu, Yuhang, et al.
Pubblicazione: (2025)
di: Liu, Yuhang, et al.
Pubblicazione: (2025)
QUILL: Quotation Generation Enhancement of Large Language Models
di: Xiao, Jin, et al.
Pubblicazione: (2024)
di: Xiao, Jin, et al.
Pubblicazione: (2024)
SeeClick: Harnessing GUI Grounding for Advanced Visual GUI Agents
di: Cheng, Kanzhi, et al.
Pubblicazione: (2024)
di: Cheng, Kanzhi, et al.
Pubblicazione: (2024)
EDGE: Efficient Data Selection for LLM Agents via Guideline Effectiveness
di: Zhang, Yunxiao, et al.
Pubblicazione: (2025)
di: Zhang, Yunxiao, et al.
Pubblicazione: (2025)
Selective Expert Guidance for Effective and Diverse Exploration in Reinforcement Learning of LLMs
di: Jiang, Zishang, et al.
Pubblicazione: (2025)
di: Jiang, Zishang, et al.
Pubblicazione: (2025)
What Makes an Ideal Quote? Recommending "Unexpected yet Rational" Quotations via Novelty
di: Zhang, Bowei, et al.
Pubblicazione: (2025)
di: Zhang, Bowei, et al.
Pubblicazione: (2025)
GUI-G1: Understanding R1-Zero-Like Training for Visual Grounding in GUI Agents
di: Zhou, Yuqi, et al.
Pubblicazione: (2025)
di: Zhou, Yuqi, et al.
Pubblicazione: (2025)
Can Pre-trained Language Models Understand Chinese Humor?
di: Chen, Yuyan, et al.
Pubblicazione: (2024)
di: Chen, Yuyan, et al.
Pubblicazione: (2024)
Phi-Ground Tech Report: Advancing Perception in GUI Grounding
di: Zhang, Miaosen, et al.
Pubblicazione: (2025)
di: Zhang, Miaosen, et al.
Pubblicazione: (2025)
PropVG: End-to-End Proposal-Driven Visual Grounding with Multi-Granularity Discrimination
di: Dai, Ming, et al.
Pubblicazione: (2025)
di: Dai, Ming, et al.
Pubblicazione: (2025)
UI-Oceanus: Scaling GUI Agents with Synthetic Environmental Dynamics
di: Wu, Mengzhou, et al.
Pubblicazione: (2026)
di: Wu, Mengzhou, et al.
Pubblicazione: (2026)
GUI-Perturbed: Domain Randomization Reveals Systematic Brittleness in GUI Grounding Models
di: Wang, Yangyue, et al.
Pubblicazione: (2026)
di: Wang, Yangyue, et al.
Pubblicazione: (2026)
Towards Efficient Resume Understanding: A Multi-Granularity Multi-Modal Pre-Training Approach
di: Jiang, Feihu, et al.
Pubblicazione: (2024)
di: Jiang, Feihu, et al.
Pubblicazione: (2024)
META-GUI: Towards Multi-modal Conversational Agents on Mobile GUI
di: Sun, Liangtai, et al.
Pubblicazione: (2022)
di: Sun, Liangtai, et al.
Pubblicazione: (2022)
SEA-Eval: A Benchmark for Evaluating Self-Evolving Agents Beyond Episodic Assessment
di: Jiang, Sihang, et al.
Pubblicazione: (2026)
di: Jiang, Sihang, et al.
Pubblicazione: (2026)
Documenti analoghi
-
Reason from Fallacy: Enhancing Large Language Models' Logical Reasoning through Logical Fallacy Understanding
di: Li, Yanda, et al.
Pubblicazione: (2024) -
RLAP: A Reinforcement Learning Enhanced Adaptive Planning Framework for Multi-step NLP Task Solving
di: Ding, Zepeng, et al.
Pubblicazione: (2025) -
Enhancing Quantitative Reasoning Skills of Large Language Models through Dimension Perception
di: Huang, Yuncheng, et al.
Pubblicazione: (2023) -
GUI-ARP: Enhancing Grounding with Adaptive Region Perception for GUI Agents
di: Ye, Xianhang, et al.
Pubblicazione: (2025) -
ToNER: Type-oriented Named Entity Recognition with Generative Language Model
di: Jiang, Guochao, et al.
Pubblicazione: (2024)