Нормализацию поименованных сущностей и разрешение неоднозначностей называют разрешением кореференций (coreference resolution) или разрешением анафор (anaphora resolution) — особенно это относится к местоимениям и другим названиям, зависящим от контекста.
Закон Ципфа гласит, что в некотором корпусе высказываний на естественном языке частотность любого слова обратно пропорциональна его позиции в таблице частотностей.