Lit2Vec-projektet använder Word2Vec-algoritmen (CBOW-versionen) på Goodreads-data för att representera böcker som vektorer. Projektet tillhandahåller Google Colab-anteckningsböcker för datarensning, träning av bokvektorer och analys, vilka kräver 'ratings.csv' och 'books.csv' från goodbooks-10k-datasetet. Analysen av bokvektorerna utförs med t-SNE-plots, som visar hur böcker klustrar sig efter genre, tema och författare, inklusive exempel på Fantasy, Sci-fi, klassiker, barnböcker och facklitteratur. Artikeln demonstrerar även likhets- och aritmetiska egenskaper hos bokvektorerna, såsom "vampire classic - vampire = Classics". Individuella bokkartor för populära titlar som Harry Potter, Dune och A Brief History of Time visar de 500 närmaste inbäddningarna.