Rzeczywiste zbiory danych bardzo często zawierają dane numeryczne oraz są niekompletne. Zastąpienie wielu wartości atrybutu numerycznego niewielką liczbą przedziałów, wynikających z dyskretyzacji, może poprawić wydajność oraz dokładność klasyfikacji, zwłaszcza w przypadku nie w pełni poprawnych danych uczących. Ważny jest wybór odpowiedniej techniki dyskretyzacji. Z tego powodu podjęto badania, których celem jest ocena wpływu różnych technik dyskretyzacji, redukcji przedziałów oraz atrybutów na jakość procesu uczenia oraz złożoność modeli uczenia. Jednocześnie brakujące, nieznane wartości atrybutów nie oznaczają wartości niemożliwych do analizy, dla takich przewidziane jest specjalne oznaczenie w zbiorze. Z uwagi na fakt, że głównymi przyczynami niekompletności są wartości utracone albo wartości uznane za nieistotne, podjęto również badania nad rozwojem metod eksploracji danych z zastosowaniem wspomnianych interpretacji.