Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

HW_18 #4

Open
wants to merge 29 commits into
base: main
Choose a base branch
from
Open

HW_18 #4

wants to merge 29 commits into from

Conversation

LinaWhite15
Copy link
Owner

No description provided.

Copy link

@IvanKozlov98 IvanKozlov98 left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Параллельный лес: 22/25

  1. Не везде есть docstring-и и аннотации к типам -4б
  2. bioinfUtils.py — неподходящее название (camelCase , когда все остальные файлы snake_case нехорошо ) — лучше так bioinf_utils.py -1б
  3. 3/4 примера в jupyter-ноутбуке Showcases.ipynb -5б
  4. кажется, вы забыли добавить @pytest.fixture к входным параметрам тестов, без этого они не запустятся
    (только, если не вручную запускать — но тогда пропадает смысл использования pytest). -3б

+1 балл за красивый и информативный readme

Итого: 35 баллов


self.classes_ = sorted(np.unique(y))

with ThreadPoolExecutor(n_jobs) as pool:

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

-3 балла (CPU-bound задача - нужны процессы)
То есть нужно было использовать ProcessPoolExecutor

tree = DecisionTreeClassifier(
max_depth=self.max_depth, max_features=self.max_features, random_state=self.random_state+i)

temp_pool.append(pool.submit(tree.fit, X_sample, y_sample))

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

непосредственный фитинг деревьев вы сделали параллельным (псевдо, конечно)
но забыли про подготовку данных и создание объекта дерева -- было бы здорово также делать это параллельно. :)

Comment on lines +57 to +58
temp_pool = [pool.submit(tree.predict_proba, X[:, self.feat_ids_by_tree[i]])
for i, tree in enumerate(self.trees)]

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

в целом ок, но почему не map ?)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants