ModelTC · bruce1408 · Oct 9, 2025 · Oct 9, 2025 · Oct 11, 2025 · Oct 11, 2025
diff --git a/.gitignore b/.gitignore
@@ -15,3 +15,4 @@ build/
 
 # macOS
 *.DS_Store
+Dockerfile*
diff --git a/Examples/mobilenet_v2/1_train_load_weights.py b/Examples/mobilenet_v2/1_train_load_weights.py
@@ -0,0 +1,173 @@
+import os
+import torch
+import torch.nn as nn
+import torch.optim as optim
+from torch.optim import lr_scheduler
+import time
+import copy
+
+from mbv2 import mobilenet_v2
+from dataset import get_dataset
+from common.configs import get_cfg_defaults
+cfg = get_cfg_defaults()
+
+os.environ["CUDA_VISIBLE_DEVICES"] = cfg.SYSTEM.CUDA_IDS
+
+def train_model(
+    model, 
+    dataloaders,
+    dataset_sizes,
+    criterion,
+    optimizer,
+    scheduler,
+    num_epochs=25
+):
+    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
+    since = time.time()
+    # liveloss = PlotLosses()
+    best_model_wts = copy.deepcopy(model.state_dict())
+    best_acc = 0.0
+
+    for epoch in range(num_epochs):
+        print("Epoch {}/{}".format(epoch + 1, num_epochs), flush=True)
+        print("-" * 10, flush=True)
+
+        # Each epoch has a training and validation phase
+        for phase in ["train", "val"]:
+            if phase == "train":
+                # scheduler.step()
+                model.train()  # Set model to training mode
+            else:
+                model.eval()  # Set model to evaluate mode
+
+            running_loss = 0.0
+            running_corrects = 0
+
+            # Iterate over data.
+            print(f"\n--- phase : {phase} ---\n", flush=True)
+            for i, (inputs, labels) in enumerate(dataloaders[phase]):
+                inputs = inputs.to(device)
+                labels = labels.to(device)
+
+                # zero the parameter gradients
+                optimizer.zero_grad()
+
+                # forward
+                # track history if only in train
+                with torch.set_grad_enabled(phase == "train"):
+                    outputs = model(inputs)
+                    _, preds = torch.max(outputs, 1)
+                    loss = criterion(outputs, labels)
+
+                    # backward + optimize only if in training phase
+                    if phase == "train":
+                        loss.backward()
+                        optimizer.step()
+
+                # statistics
+                running_loss += loss.item() * inputs.size(0)
+                running_corrects += torch.sum(preds == labels.data)
+
+                if i % 10 == 0:
+                    print(
+                        "\rIteration: {}/{}, Loss: {}, LR: {} ".format(
+                            i + 1, len(dataloaders[phase]), loss.item() * inputs.size(0),
+                            optimizer.param_groups[0]['lr']
+                        ), flush=True
+                    )
+
+            epoch_loss = running_loss / dataset_sizes[phase]
+            epoch_acc = running_corrects.double() / dataset_sizes[phase]
+            if phase == "train":
+                avg_loss = epoch_loss
+                t_acc = epoch_acc
+            else:
+                val_loss = epoch_loss
+                val_acc = epoch_acc
+
+            if phase == "val" and epoch_acc > best_acc:
+                best_acc = epoch_acc
+                best_model_wts = copy.deepcopy(model.state_dict())
+
+        print("Train Loss: {:.4f} Acc: {:.4f}".format(avg_loss, t_acc), flush=True)
+        print("Val Loss: {:.4f} Acc: {:.4f}".format(val_loss, val_acc), flush=True)
+        print("Best Val Accuracy: {}".format(best_acc), flush=True)
+        print()
+        scheduler.step()
+
+
+    time_elapsed = time.time() - since
+    print(
+        "Training complete in {:.0f}m {:.0f}s".format(
+            time_elapsed // 60, time_elapsed % 60
+        ), flush=True
+    )
+    print("Best val Acc: {:4f}".format(best_acc), flush=True)
+
+    # load best model weights
+    model.load_state_dict(best_model_wts)
+    return model
+
+if torch.cuda.is_available():
+    num_gpus = torch.cuda.device_count()
+    print(f"--- PyTorch can see {num_gpus} GPUs ---")
+    if num_gpus < 2:
+        print("--- WARNING: DataParallel will not be effective with less than 2 GPUs. ---")
+else:
+    print("--- CUDA is not available, running on CPU. ---")
+
+model = mobilenet_v2(num_classes=200)
+model_path= "/mnt/share_disk/bruce_trie/workspace/Quantizer-Tools/MQBench/Examples/models/mobilenet_v2-b0353104.pth"
+weight_imagenet = torch.load(model_path)
+weight_imagenet.pop("classifier.1.weight")
+weight_imagenet.pop("classifier.1.bias")
+model.load_state_dict(weight_imagenet, strict=False)
+
+model.train()
+
+
+device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
+model = model.to(device)
+
+# Multi GPU
+model = torch.nn.DataParallel(model)
+
+# Loss Function
+criterion = nn.CrossEntropyLoss()
+# Observe that all parameters are being optimized
+optimizer_ft = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
+
+# Decay LR by a factor of 0.1 every 7 epochs
+exp_lr_scheduler = lr_scheduler.StepLR(optimizer_ft, step_size=7, gamma=0.1)
+
+train_dataset, val_dataset, _ = get_dataset()
+
+train_loaders = torch.utils.data.DataLoader(
+    train_dataset, batch_size=512, shuffle=True, num_workers=8
+)
+
+val_loaders = torch.utils.data.DataLoader(
+    val_dataset, batch_size=512, shuffle=True, num_workers=8
+)
+
+
+dataloaders = {}
+dataloaders["train"] = train_loaders
+dataloaders["val"] = val_loaders
+
+dataset_sizes = {}
+dataset_sizes["train"] = len(train_dataset)
+dataset_sizes["val"] = len(val_dataset)
+
+model = train_model(
+    model,
+    dataloaders,
+    dataset_sizes,
+    criterion,
+    optimizer_ft,
+    exp_lr_scheduler,
+    num_epochs=15,
+)
+
+model.eval()
+torch.save(model.state_dict(), "/mnt/share_disk/bruce_trie/workspace/Quantizer-Tools/MQBench/Examples/models/mbv2_fp16.pth")
diff --git a/Examples/mobilenet_v2/2_train_load_full_model.py b/Examples/mobilenet_v2/2_train_load_full_model.py
@@ -0,0 +1,191 @@
+import os
+import time
+import copy
+import torch
+import torch.nn as nn
+import torch.optim as optim
+from torch.optim import lr_scheduler
+from mbv2 import mobilenet_v2
+from dataset import get_dataset
+from common.configs import get_cfg_defaults
+cfg = get_cfg_defaults()
+
+os.environ["CUDA_VISIBLE_DEVICES"] = cfg.SYSTEM.CUDA_IDS
+
+def train_model(
+    model, 
+    dataloaders, 
+    dataset_sizes,
+    criterion,
+    optimizer,
+    scheduler,
+    device,
+    num_epochs=25
+):
+    since = time.time()
+    # liveloss = PlotLosses()
+    best_model = copy.deepcopy(model)
+    best_acc = 0.0
+
+    for epoch in range(num_epochs):
+        print("Epoch {}/{}".format(epoch + 1, num_epochs), flush=True)
+        print("-" * 10, flush=True)
+
+        # Each epoch has a training and validation phase
+        for phase in ["train", "val"]:
+            if phase == "train":
+                model.train()  # Set model to training mode
+            else:
+                model.eval()  # Set model to evaluate mode
+
+            running_loss = 0.0
+            running_corrects = 0
+
+            # Iterate over data.
+            print(f"\n--- phase : {phase} ---\n", flush=True)
+            for i, (inputs, labels) in enumerate(dataloaders[phase]):
+                inputs = inputs.to(device)
+                labels = labels.to(device)
+
+                # zero the parameter gradients
+                optimizer.zero_grad()
+
+                # forward track history if only in train
+                with torch.set_grad_enabled(phase == "train"):
+                    outputs = model(inputs)
+                    _, preds = torch.max(outputs, 1)
+                    loss = criterion(outputs, labels)
+
+                    # backward + optimize only if in training phase
+                    if phase == "train":
+                        loss.backward()
+                        optimizer.step()
+
+                # statistics
+                running_loss += loss.item() * inputs.size(0)
+                running_corrects += torch.sum(preds == labels.data)
+
+                if i % 5 == 0:
+                    print(
+                        "\rIteration: {}/{}, Loss: {}, LR: {} ".format(
+                            i + 1, len(dataloaders[phase]), loss.item() * inputs.size(0),
+                            optimizer.param_groups[0]['lr']
+                        ), flush=True
+                    )
+
+            epoch_loss = running_loss / dataset_sizes[phase]
+            epoch_acc = running_corrects.double() / dataset_sizes[phase]
+            if phase == "train":
+                avg_loss = epoch_loss
+                t_acc = epoch_acc
+            else:
+                val_loss = epoch_loss
+                val_acc = epoch_acc
+
+            if phase == "val" and epoch_acc > best_acc:
+                best_acc = epoch_acc
+                best_model = copy.deepcopy(model)
+
+        print("Train Loss: {:.4f} Acc: {:.4f}".format(avg_loss, t_acc), flush=True)
+        print("Val Loss: {:.4f} Acc: {:.4f}".format(val_loss, val_acc), flush=True)
+        print("Best Val Accuracy: {}".format(best_acc), flush=True)
+        print()
+
+        if isinstance(scheduler, lr_scheduler.ReduceLROnPlateau):
+            scheduler.step(val_acc)
+        elif scheduler is not None:
+            scheduler.step()
+
+
+    time_elapsed = time.time() - since
+    print(
+        "Training complete in {:.0f}m {:.0f}s".format(
+            time_elapsed // 60, time_elapsed % 60
+        ), flush=True
+    )
+    print("Best val Acc: {:4f}".format(best_acc), flush=True)
+
+    # load best model weights
+    return best_model
+
+if torch.cuda.is_available():
+    num_gpus = torch.cuda.device_count()
+    print(f"--- PyTorch can see {num_gpus} GPUs ---")
+    if num_gpus < 2:
+        print("--- WARNING: DataParallel will not be effective with less than 2 GPUs. ---")
+else:
+    print("--- CUDA is not available, running on CPU. ---")
+
+# model = mobilenet_v2(num_classes=200)
+# model_path= "/mnt/share_disk/bruce_trie/workspace/Quantizer-Tools/MQBench/Examples/models/mobilenet_v2-b0353104.pth"
+# weight_imagenet = torch.load(model_path)
+# weight_imagenet.pop("classifier.1.weight")
+# weight_imagenet.pop("classifier.1.bias")
+# model.load_state_dict(weight_imagenet, strict=False)
+
+model = mobilenet_v2(num_classes=1000)  # 先用预训练时的类别数(1000)创建
+
+model_path= "/mnt/share_disk/bruce_trie/workspace/Quantizer-Tools/MQBench/Examples/models/mobilenet_v2-b0353104.pth"
+
+state_dict = torch.load(model_path, weights_only=True) # 使用安全模式
+
+model.load_state_dict(state_dict)
+
+model.classifier[1] = torch.nn.Linear(model.classifier[1].in_features, 200)
+
+model.train()
+
+device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
+
+model = model.to(device)
+
+# Multi GPU
+model = torch.nn.DataParallel(model)
+
+# Loss Function
+criterion = nn.CrossEntropyLoss()
+
+# Observe that all parameters are being optimized
+optimizer_ft = optim.Adam(model.parameters(), lr=0.001, weight_decay=1e-4) 
+
+exp_lr_scheduler = lr_scheduler.ReduceLROnPlateau(
+    optimizer_ft, 
+    mode='max', 
+    factor=0.5, 
+    patience=5, 
+)
+
+# optimizer_ft = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
+
+# Decay LR by a factor of 0.1 every 7 epochs
+# exp_lr_scheduler = lr_scheduler.StepLR(optimizer_ft, step_size=7, gamma=0.1)
+
+train_dataset, val_dataset, _ = get_dataset()
+
+train_loaders = torch.utils.data.DataLoader(
+    train_dataset, batch_size=256, shuffle=True, num_workers=16)
+
+val_loaders = torch.utils.data.DataLoader(
+    val_dataset, batch_size=256, shuffle=False, num_workers=16)
+
+dataloaders = {}
+dataloaders["train"] = train_loaders
+dataloaders["val"] = val_loaders
+
+dataset_sizes = {}
+dataset_sizes["train"] = len(train_dataset)
+dataset_sizes["val"] = len(val_dataset)
+
+model = train_model(
+    model,
+    dataloaders,
+    dataset_sizes,
+    criterion,
+    optimizer_ft,
+    exp_lr_scheduler,
+    device=device,
+    num_epochs=15,
+)
+
+model.eval()
+torch.save(model, "/mnt/share_disk/bruce_trie/workspace/Quantizer-Tools/MQBench/Examples/models/mbv2_fp16.pth")
Original file line number	Diff line number	Diff line change
Expand Up		@@ -15,3 +15,4 @@ build/

		# macOS
		*.DS_Store
		Dockerfile*