Hledání nejdelšího společného podřetězce
Skočit na navigaci
Skočit na vyhledávání
Pro výběr nejdelšího společného podřetězce jsem si napsal dvě funkce.
První generuje všechny podřetězce v řetězci:
CREATE OR REPLACE FUNCTION substrings(text)
RETURNS text[] AS $$
SELECT array(SELECT DISTINCT substring($1 from i for j)
FROM generate_series(1, length($1)) g(i),
generate_series(1, length($1)) h(j)
)
$$ LANGUAGE sql;
postgres=# SELECT substrings('pavel');
substrings
-----------------------------------------------------
{e,vel,avel,p,pav,a,pavel,pa,av,ve,ave,l,pave,el,v}
(1 row)
Druhá vrací pole nejdelších společných podřetězců:
CREATE OR REPLACE FUNCTION max_common_substring(text, text)
RETURNS text[] AS $$
SELECT ARRAY(SELECT x
FROM (SELECT $1, x, length(x), rank() OVER (ORDER BY length(x) DESC)
FROM unnest(substrings($2)) g(x)
WHERE strpos($1,x) > 0) xx
WHERE rank = 1)
$$ LANGUAGE sql;
postgres=# SELECT max_common_substring('stěhula','stěhule');
max_common_substring
----------------------
{stěhul}
(1 row)