본문 바로가기 메뉴 바로가기

HJunS

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

HJunS

검색하기 폼
  • 분류 전체보기 (17)
    • 혼공단 (7)
    • 논문 리뷰 (8)
    • Kaggle (1)
    • RunPod (1)
  • 방명록

2025/07/02 (1)
OS-ATLAS: A FOUNDATION ACTION MODEL FOR GENERALIST GUI AGENTS

ABSTRACT문제 정의이 논문은 GUI agents 개발이 오픈소스와 차이가 너무 크기 때문에, GPT-4o, GeminiPro-Vision과 같은 상용 비전-언어 모델VLM에 크게 의존하는 한계를 이야기한다.특히 GUI grounding 과 Out-Of-Distribution OOD scenarios에서 오픈소스 모델의 성능이 크게 차이 난다문제 해결 OS-Atlas foundational GUI action model인 OS-Atlas를 개발했다.데이터와 모델링 측면을 개선해 GUI grounding 과 OOD agentic tasks에도 탁월한 성능을 보인다.GUI Data 데이터 합성(Synthesizing GUI grounding data)Windows, Linux, macOS, Androi..

논문 리뷰 2025. 7. 2. 01:55
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
more
«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바