|
MCP vs RAG vs NLWeb vs HTML: a comparison of the effectiveness and efficiency of different agent interfaces to the web
Steiner, Aaron
;
Peeters, Ralph
;
Bizer, Christian
![[img]](https://madoc.bib.uni-mannheim.de/72130/1.hassmallThumbnailVersion/3774904.3792893.pdf)  Vorschau |
|
PDF
3774904.3792893.pdf
- Veröffentlichte Version
Download (1MB)
|
|
DOI:
|
https://doi.org/10.1145/3774904.3792893
|
|
URL:
|
https://dl.acm.org/doi/10.1145/3774904.3792893
|
|
URN:
|
urn:nbn:de:bsz:180-madoc-721302
|
|
Dokumenttyp:
|
Konferenzveröffentlichung
|
|
Erscheinungsjahr Online:
|
2026
|
|
Datum:
|
12 April 2026
|
|
Buchtitel:
|
WWW '26 : Proceedings of the ACM Web Conference 2026
|
|
Seitenbereich:
|
8493-8496
|
|
Veranstaltungstitel:
|
WWW '26: The ACM Web Conference 2026
|
|
Veranstaltungsort:
|
Dubai, United Arab Emirates
|
|
Veranstaltungsdatum:
|
13.-17.04.2026
|
|
Herausgeber:
|
Hacid, Hakim
;
Maarek, Yoelle
|
|
Ort der Veröffentlichung:
|
New York, NY, USA
|
|
Verlag:
|
Association for Computing Machinery
|
|
ISBN:
|
979-8-4007-2307-0
|
|
Verwandte URLs:
|
|
|
Sprache der Veröffentlichung:
|
Englisch
|
|
Einrichtung:
|
Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Information Systems V: Web-based Systems (Bizer 2012-)
|
|
Bereits vorhandene Lizenz:
|
Creative Commons Namensnennung 4.0 International (CC BY 4.0)
|
|
Fachgebiet:
|
004 Informatik
|
|
Freie Schlagwörter (Deutsch):
|
web agents , llm agents , rag , mcp , nlweb , electronic commerce
|
|
Abstract:
|
LLM-based agents are increasingly used to automate web tasks such as product search, offer comparison, and order placement. Current research explores different interfaces through which these agents interact with websites, including traditional HTML browsing, retrieval-augmented generation (RAG) over pre-crawled content, communication via Web APIs using the Model Context Protocol (MCP), and natural-language querying through the NLWeb interface. Yet no systematic comparison of the effectiveness and efficiency of these interfaces on identical challenging task sets exists. To address this gap, we introduce a testbed consisting of four simulated e-shops, each offering its products via HTML, MCP, and NLWeb interfaces. For each interface (HTML, RAG, MCP, and NLWeb), we develop specialized agents that perform the same sets of tasks, ranging from simple product searches and price comparisons to complex queries for complementary or substitute products and checkout processes. We evaluate the agents using GPT-5 and GPT-5-mini. Our evaluation shows that RAG, MCP, and NLWeb agents outperform HTML browsing agents by 11 percentage points in task completion while requiring 2–5 times fewer tokens on search-oriented tasks. The GPT-5 RAG agent achieves the highest task completion rate (0.79) while maintaining moderate token consumption.
|
|
Zusätzliche Informationen:
|
Konferenz wurde auf Juni/Juli verschoben
|
 | Dieser Eintrag ist Teil der Universitätsbibliographie. |
 | Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt. |
 | Diese Publikation ist bisher nur Online erschienen. Diese Publikation nun als "Jetzt in Print erschienen" melden. |
Suche Autoren in
Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail
Actions (login required)
 |
Eintrag anzeigen |
|