Klíčovým rozdílem mezi podobností a identitou v zarovnání sekvence je to, že podobnost je podobnost (podobnost) mezi dvěma sekvencemi ve srovnání, zatímco identita je počet znaků, které se přesně shodují mezi dvěma různými sekvencemi.
Bioinformatika je interdisciplinární vědní obor, který zahrnuje hlavně molekulární biologii a genetiku, informatiku, matematiku a statistiku. Zarovnání sekvence je hlavním termínem v bioinformatice. Jedná se o postup, při kterém jsou sekvence DNA, RNA nebo proteinu uspořádány tak, aby identifikovaly oblasti podobnosti, což je důsledek funkčního, strukturálního nebo evolučního vztahu mezi sekvencemi. Na konci zarovnání budou prezentovány jako řádky v matici. Za účelem zarovnání identických znaků v po sobě jdoucích Coloumech jsou mezi zbytky vložené mezery.