Finding similar/related texts algorithms

Artikeln presenterar algoritmer för att hitta liknande eller relaterade texter. Den inkluderar en C#-implementering av Levenshtein-avståndsberäkningen för att mäta skillnaden mellan två strängar. Verktyg som Boilerpipe och OTS (Open Text Summarizer) nämns som användbara för textanalys. OTS framhålls som särskilt användbart för sentimentanalys genom att reducera text till nyckelfraser och ord, en metod som även kan appliceras på textlikhet.