Commenting experiments to run on freja

Centrattic · Centrattic · commit b9fe0c2a92dd · 2025-01-21T17:14:22.000-05:00
diff --git a/src/run_exp.py b/src/run_exp.py
@@ -99,81 +99,81 @@
     visualize_embedding(model.embedding.data.cpu(), title=f"{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}", save_path=f"{results_root}/emb_{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.png", dict_level = dataset['dict_level'] if 'dict_level' in dataset else None, color_dict = False if data_id == "permutation" else True, adjust_overlapping_text = False)
 
 
-## Exp2: Metric vs Overall Dataset Size (fixed train-test split)
-print(f"Experiment 2: Metric vs Overall Dataset Size (fixed train-test split)")
-data_size_list = [100, 200, 300, 400, 500, 600, 700, 800, 900, 1000]
-for i in tqdm(range(len(data_size_list))):
-    data_size = data_size_list[i]
-    param_dict = {
-        'seed': seed,
-        'data_id': data_id,
-        'data_size': data_size,
-        'train_ratio': train_ratio,
-        'model_id': model_id,
-        'device': torch.device('cuda' if torch.cuda.is_available() else 'cpu'),
-        'embd_dim': embd_dim,
-        'n_exp': n_exp,
-        'lr': lr,
-        'weight_decay':weight_decay
-    }
-
-    print(f"Training model with seed {seed}, data_id {data_id}, model_id {model_id}, n_exp {n_exp}, embd_dim {embd_dim}")
-    ret_dic = train_single_model(param_dict)
-    model = ret_dic['model']
-    dataset = ret_dic['dataset']
-
-    torch.save(model.state_dict(), f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.pt")
-    with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}_train_results.json", "w") as f:
-        json.dump(ret_dic["results"], f, indent=4)
+# ## Exp2: Metric vs Overall Dataset Size (fixed train-test split)
+# print(f"Experiment 2: Metric vs Overall Dataset Size (fixed train-test split)")
+# data_size_list = [100, 200, 300, 400, 500, 600, 700, 800, 900, 1000]
+# for i in tqdm(range(len(data_size_list))):
+#     data_size = data_size_list[i]
+#     param_dict = {
+#         'seed': seed,
+#         'data_id': data_id,
+#         'data_size': data_size,
+#         'train_ratio': train_ratio,
+#         'model_id': model_id,
+#         'device': torch.device('cuda' if torch.cuda.is_available() else 'cpu'),
+#         'embd_dim': embd_dim,
+#         'n_exp': n_exp,
+#         'lr': lr,
+#         'weight_decay':weight_decay
+#     }
+
+#     print(f"Training model with seed {seed}, data_id {data_id}, model_id {model_id}, n_exp {n_exp}, embd_dim {embd_dim}")
+#     ret_dic = train_single_model(param_dict)
+#     model = ret_dic['model']
+#     dataset = ret_dic['dataset']
+
+#     torch.save(model.state_dict(), f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.pt")
+#     with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}_train_results.json", "w") as f:
+#         json.dump(ret_dic["results"], f, indent=4)
     
-    if data_id == "family_tree":
-        aux_info["dict_level"] = dataset['dict_level']
+#     if data_id == "family_tree":
+#         aux_info["dict_level"] = dataset['dict_level']
     
-    if hasattr(model.embedding, 'weight'):
-        metric_dict = crystal_metric(model.embedding.weight.cpu().detach(), data_id, aux_info)
-    else:
-        metric_dict = crystal_metric(model.embedding.data.cpu(), data_id, aux_info)
-
-    with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.json", "w") as f:
-        json.dump(metric_dict, f, indent=4)
-
-## Exp3: Metric vs Train Fraction (fixed dataset size)
-print(f"Experiment 3: Metric vs Train Fraction (fixed dataset size)")
-train_ratio_list = np.arange(1, 10) / 10
-data_size = 1000
-for i in tqdm(range(len(train_ratio_list))):
-    train_ratio = train_ratio_list[i]
-    param_dict = {
-        'seed': seed,
-        'data_id': data_id,
-        'data_size': data_size,
-        'train_ratio': train_ratio,
-        'model_id': model_id,
-        'device': torch.device('cuda' if torch.cuda.is_available() else 'cpu'),
-        'embd_dim': embd_dim,
-        'n_exp': n_exp,
-        'lr': lr,
-        'weight_decay':weight_decay
-    }
-    print(f"Training model with seed {seed}, data_id {data_id}, model_id {model_id}, n_exp {n_exp}, embd_dim {embd_dim}")
-    ret_dic = train_single_model(param_dict)
-    model = ret_dic['model']
-    dataset = ret_dic['dataset']
-
-    torch.save(model.state_dict(), f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.pt")
-    with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}_train_results.json", "w") as f:
-        json.dump(ret_dic["results"], f, indent=4)
-
-    if data_id == "family_tree":
-        aux_info["dict_level"] = dataset['dict_level']
+#     if hasattr(model.embedding, 'weight'):
+#         metric_dict = crystal_metric(model.embedding.weight.cpu().detach(), data_id, aux_info)
+#     else:
+#         metric_dict = crystal_metric(model.embedding.data.cpu(), data_id, aux_info)
+
+#     with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.json", "w") as f:
+#         json.dump(metric_dict, f, indent=4)
+
+# ## Exp3: Metric vs Train Fraction (fixed dataset size)
+# print(f"Experiment 3: Metric vs Train Fraction (fixed dataset size)")
+# train_ratio_list = np.arange(1, 10) / 10
+# data_size = 1000
+# for i in tqdm(range(len(train_ratio_list))):
+#     train_ratio = train_ratio_list[i]
+#     param_dict = {
+#         'seed': seed,
+#         'data_id': data_id,
+#         'data_size': data_size,
+#         'train_ratio': train_ratio,
+#         'model_id': model_id,
+#         'device': torch.device('cuda' if torch.cuda.is_available() else 'cpu'),
+#         'embd_dim': embd_dim,
+#         'n_exp': n_exp,
+#         'lr': lr,
+#         'weight_decay':weight_decay
+#     }
+#     print(f"Training model with seed {seed}, data_id {data_id}, model_id {model_id}, n_exp {n_exp}, embd_dim {embd_dim}")
+#     ret_dic = train_single_model(param_dict)
+#     model = ret_dic['model']
+#     dataset = ret_dic['dataset']
+
+#     torch.save(model.state_dict(), f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.pt")
+#     with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}_train_results.json", "w") as f:
+#         json.dump(ret_dic["results"], f, indent=4)
+
+#     if data_id == "family_tree":
+#         aux_info["dict_level"] = dataset['dict_level']
     
-    if hasattr(model.embedding, 'weight'):
-        metric_dict = crystal_metric(model.embedding.weight.cpu().detach(), data_id, aux_info)
-    else:
-        metric_dict = crystal_metric(model.embedding.data.cpu(), data_id, aux_info)
+#     if hasattr(model.embedding, 'weight'):
+#         metric_dict = crystal_metric(model.embedding.weight.cpu().detach(), data_id, aux_info)
+#     else:
+#         metric_dict = crystal_metric(model.embedding.data.cpu(), data_id, aux_info)
 
-    with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}_metric.json", "w") as f:
-        json.dump(metric_dict, f, indent=4)
+#     with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}_metric.json", "w") as f:
+#         json.dump(metric_dict, f, indent=4)
 
 ## Exp4: Grokking plot: Run with different seeds
 print(f"Experiment 4: Train with different seeds")
@@ -215,43 +215,43 @@
     with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.json", "w") as f:
         json.dump(metric_dict, f, indent=4)
 
-#Exp5: N Exponent value plot: Run with different n values, plot test accuracy vs. and explained variance vs.
-
-print(f"Experiment 5: Train with different exponent values")
-n_list = np.arange(1, 17, dtype=int)
-
-for i in tqdm(range(len(n_list))):
-    n_exp = n_list[i]
-    data_size = 1000
-    train_ratio = 0.8
-
-    param_dict = {
-        'seed': seed,
-        'data_id': data_id,
-        'data_size': data_size,
-        'train_ratio': train_ratio,
-        'model_id': model_id,
-        'device': torch.device('cuda' if torch.cuda.is_available() else 'cpu'),
-        'embd_dim': embd_dim,
-        'n_exp': n_exp
-    }
-    print(f"Training model with seed {seed}, data_id {data_id}, model_id {model_id}, n_exp {n_exp}, embd_dim {embd_dim}")
+# #Exp5: N Exponent value plot: Run with different n values, plot test accuracy vs. and explained variance vs.
+
+# print(f"Experiment 5: Train with different exponent values")
+# n_list = np.arange(1, 17, dtype=int)
+
+# for i in tqdm(range(len(n_list))):
+#     n_exp = n_list[i]
+#     data_size = 1000
+#     train_ratio = 0.8
+
+#     param_dict = {
+#         'seed': seed,
+#         'data_id': data_id,
+#         'data_size': data_size,
+#         'train_ratio': train_ratio,
+#         'model_id': model_id,
+#         'device': torch.device('cuda' if torch.cuda.is_available() else 'cpu'),
+#         'embd_dim': embd_dim,
+#         'n_exp': n_exp
+#     }
+#     print(f"Training model with seed {seed}, data_id {data_id}, model_id {model_id}, n_exp {n_exp}, embd_dim {embd_dim}")
     
-    ret_dic = train_single_model(param_dict)
-    model = ret_dic['model']
-    dataset = ret_dic['dataset']
-    torch.save(model.state_dict(), f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.pt")
-    with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}_train_results.json", "w") as f:
-        json.dump(ret_dic["results"], f, indent=4)
-
-    if data_id == "family_tree":
-        aux_info["dict_level"] = dataset['dict_level']
-
-    if hasattr(model.embedding, 'weight'):
-        metric_dict = crystal_metric(model.embedding.weight.cpu().detach(), data_id, aux_info)
-    else:
-        metric_dict = crystal_metric(model.embedding.data.cpu(), data_id, aux_info)
-
-    with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.json", "w") as f:
-        json.dump(metric_dict, f, indent=4)
+#     ret_dic = train_single_model(param_dict)
+#     model = ret_dic['model']
+#     dataset = ret_dic['dataset']
+#     torch.save(model.state_dict(), f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.pt")
+#     with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}_train_results.json", "w") as f:
+#         json.dump(ret_dic["results"], f, indent=4)
+
+#     if data_id == "family_tree":
+#         aux_info["dict_level"] = dataset['dict_level']
+
+#     if hasattr(model.embedding, 'weight'):
+#         metric_dict = crystal_metric(model.embedding.weight.cpu().detach(), data_id, aux_info)
+#     else:
+#         metric_dict = crystal_metric(model.embedding.data.cpu(), data_id, aux_info)
+
+#     with open(f"{results_root}/{seed}_{data_id}_{model_id}_{data_size}_{train_ratio}_{n_exp}.json", "w") as f:
+#         json.dump(metric_dict, f, indent=4)