Posts Tagged ‘String Similarity’

SimMetrics: misurare la similarità tra stringhe in Java

In questo post vedremo una libreria Open Source Java che ci permette di misurare la similarità tra due stringhe utilizzando diverse metriche, denominata Simmetrics. Questa è stata sviluppata da Sam Chapman dell’Universita di Sheffield e rilasciata secondo la licenza GNU GPL.

Edit Distance o Levenshtein Distance: un algoritmo di similarità tra stringhe

In questo posto vedremo l’algoritmo di Editi Distance [1] detto anche di Levenshtein Distance. La edit distance, o distanza di Levenshtein, tra due stringhe s1 e s2 il minimo numero di sostituzioni, cancellazioni o inserimenti che occorre effettuare per ottenere s1 da s2. Ad esempio, la distanza tra gtgcca e ggcga è 2 (bisogna inserire una t nella seconda stringa e sostituire la penultima g con c per ottenere la prima stringa).

elettronica