Enhancing Knowledge Graphs with LLMs: A novel approach to keyword extraction and synonym merging

Ett gemensamt projekt mellan EQT Motherbrain och Nobel Prize Outreach (NPO) utforskar hur kunskapsgrafer (KGs) kan berikas med meningsfulla kopplingar. Projektet använder stora språkmodeller (LLM:er), specifikt OpenAI:s GPT-4, för att extrahera relevanta nyckelord, kallade "Fields of impact", från Nobelpristagares biografier och föreläsningar. En ny metodik, baserad på parvis likhetsutvärdering av inbäddningar, utvecklades för att upptäcka och slå samman synonyma nyckelord, vilket förbättrar KG-konnektiviteten. Wikidata används som en grund för att konstruera en kunskapsgraf med information om Nobelpriser och pristagare, som sedan berikas med de extraherade nyckelorden. Målet är att skapa en rikare kunskapsgraf för att upptäcka nya kopplingar mellan Nobelpristagare för berättande och interaktiva visualiseringar, exempelvis på Nobel Prize Museum.