[BUG] ERROR: byte not found in vocab: #2061

linhcentrio · 2024-08-16T11:01:37Z

Pre-check

I have searched the existing issues and none cover this bug.

Description

`D:\privateGPT>make run
poetry run python -m private_gpt
17:57:49.060 [INFO ] private_gp 17:58:23.851 [INFO ] private_gp ggml_init_cublas: found 1 Device 0: NVIDIA GeForce llama_model_loader: loaded llama_model_loader: - tensor 0: llama_model_loader: - tensor 1: llama_model_loader: - tensor 2: llama_model_loader: - tensor 3: llama_model_loader: - tensor 4: llama_model_loader: - tensor 5: llama_model_loader: - tensor 6: llama_model_loader: - tensor 7: llama_model_loader: - tensor 8: llama_model_loader: - tensor 9: llama_model_loader: - tensor 10: llama_model_loader: - tensor 11: llama_model_loader: - tensor 12: llama_model_loader: - tensor 13: llama_model_loader: - tensor 14: llama_model_loader: - tensor 15: llama_model_loader: - tensor 16: llama_model_loader: - tensor 17: llama_model_loader: - tensor 18: llama_model_loader: - tensor 19: llama_model_loader: - tensor 20: llama_model_loader: - tensor 21: llama_model_loader: - tensor 22: llama_model_loader: - tensor 23: llama_model_loader: - tensor 24: llama_model_loader: - tensor 25: llama_model_loader: - tensor 26: llama_model_loader: - tensor 27: llama_model_loader: - tensor 28: llama_model_loader: - tensor 29: llama_model_loader: - tensor 30: llama_model_loader: - tensor 31: llama_model_loader: - tensor 32: llama_model_loader: - tensor 33: llama_model_loader: - tensor 34: llama_model_loader: - tensor 35: llama_model_loader: - tensor 36: llama_model_loader: - tensor 37: llama_model_loader: - tensor 38: llama_model_loader: - tensor 39: llama_model_loader: - tensor 40: llama_model_loader: - tensor 41: llama_model_loader: - tensor 42: llama_model_loader: - tensor 43: llama_model_loader: - tensor 44: llama_model_loader: - tensor 45: llama_model_loader: - tensor 46: llama_model_loader: - tensor 47: llama_model_loader: - tensor 48: llama_model_loader: - tensor 49: llama_model_loader: - tensor 50: llama_model_loader: - tensor 51: llama_model_loader: - tensor 52: llama_model_loader: - tensor 53: llama_model_loader: - tensor 54: llama_model_loader: - tensor 55: llama_model_loader: - tensor 56: llama_model_loader: - tensor 57: llama_model_loader: - tensor 58: llama_model_loader: - tensor 59: llama_model_loader: - tensor 60: llama_model_loader: - tensor 61: llama_model_loader: - tensor 62: llama_model_loader: - tensor 63: llama_model_loader: - tensor 64: llama_model_loader: - tensor 65: llama_model_loader: - tensor 66: llama_model_loader: - tensor 67: llama_model_loader: - tensor 68: llama_model_loader: - tensor 69: llama_model_loader: - tensor 70: llama_model_loader: - tensor 71: llama_model_loader: - tensor 72: llama_model_loader: - tensor 73: llama_model_loader: - tensor 74: llama_model_loader: - tensor 75: llama_model_loader: - tensor 76: llama_model_loader: - tensor 77: llama_model_loader: - tensor 78: llama_model_loader: - tensor 79: llama_model_loader: - tensor 80: llama_model_loader: - tensor 81: llama_model_loader: - tensor 82: llama_model_loader: - tensor 83: llama_model_loader: - tensor 84: llama_model_loader: - tensor 85: llama_model_loader: - tensor 86: llama_model_loader: - tensor 87: llama_model_loader: - tensor 88: llama_model_loader: - tensor 89: llama_model_loader: - tensor 90: llama_model_loader: - tensor 91: llama_model_loader: - tensor 92: llama_model_loader: - tensor 93: llama_model_loader: - tensor 94: llama_model_loader: - tensor 95: llama_model_loader: - tensor 96: llama_model_loader: - tensor 97: llama_model_loader: - tensor 98: llama_model_loader: - tensor 99: llama_model_loader: - tensor 100: llama_model_loader: - tensor 101: llama_model_loader: - tensor 102: llama_model_loader: - tensor 103: llama_model_loader: - tensor 104: llama_model_loader: - tensor 105: llama_model_loader: - tensor 106: llama_model_loader: - tensor 107: llama_model_loader: - tensor 108: llama_model_loader: - tensor 109: llama_model_loader: - tensor 110: llama_model_loader: - tensor 111: llama_model_loader: - tensor 112: llama_model_loader: - tensor 113: llama_model_loader: - tensor 114: llama_model_loader: - tensor 115: llama_model_loader: - tensor 116: llama_model_loader: - tensor 117: llama_model_loader: - tensor 118: llama_model_loader: - tensor 119: llama_model_loader: - tensor 120: llama_model_loader: - tensor 121: llama_model_loader: - tensor 122: llama_model_loader: - tensor 123: llama_model_loader: - tensor 124: llama_model_loader: - tensor 125: llama_model_loader: - tensor 126: llama_model_loader: - tensor 127: llama_model_loader: - tensor 128: llama_model_loader: - tensor 129: llama_model_loader: - tensor 130: llama_model_loader: - tensor 131: llama_model_loader: - tensor 132: llama_model_loader: - tensor 133: llama_model_loader: - tensor 134: llama_model_loader: - tensor 135: llama_model_loader: - tensor 136: llama_model_loader: - tensor 137: llama_model_loader: - tensor 138: llama_model_loader: - tensor 139: llama_model_loader: - tensor 140: llama_model_loader: - tensor 141: llama_model_loader: - tensor 142: llama_model_loader: - tensor 143: llama_model_loader: - tensor 144: llama_model_loader: - tensor 145: llama_model_loader: - tensor 146: llama_model_loader: - tensor 147: llama_model_loader: - tensor 148: llama_model_loader: - tensor 149: llama_model_loader: - tensor 150: llama_model_loader: - tensor 151: llama_model_loader: - tensor 152: llama_model_loader: - tensor 153: llama_model_loader: - tensor 154: llama_model_loader: - tensor 155: llama_model_loader: - tensor 156: llama_model_loader: - tensor 157: llama_model_loader: - tensor 158: llama_model_loader: - tensor 159: llama_model_loader: - tensor 160: llama_model_loader: - tensor 161: llama_model_loader: - tensor 162: llama_model_loader: - tensor 163: llama_model_loader: - tensor 164: llama_model_loader: - tensor 165: llama_model_loader: - tensor 166: llama_model_loader: - tensor 167: llama_model_loader: - tensor 168: llama_model_loader: - tensor 169: llama_model_loader: - tensor 170: llama_model_loader: - tensor 171: llama_model_loader: - tensor 172: llama_model_loader: - tensor 173: llama_model_loader: - tensor 174: llama_model_loader: - tensor 175: llama_model_loader: - tensor 176: llama_model_loader: - tensor 177: llama_model_loader: - tensor 178: llama_model_loader: - tensor 179: llama_model_loader: - tensor 180: llama_model_loader: - tensor 181: llama_model_loader: - tensor 182: llama_model_loader: - tensor 183: llama_model_loader: - tensor 184: llama_model_loader: - tensor 185: llama_model_loader: - tensor 186: llama_model_loader: - tensor 187: llama_model_loader: - tensor 188: llama_model_loader: - tensor 189: llama_model_loader: - tensor 190: llama_model_loader: - tensor 191: llama_model_loader: - tensor 192: llama_model_loader: - tensor 193: llama_model_loader: - tensor 194: llama_model_loader: - tensor 195: llama_model_loader: - tensor 196: llama_model_loader: - tensor 197: llama_model_loader: - tensor 198: llama_model_loader: - tensor 199: llama_model_loader: - tensor 200: llama_model_loader: - tensor 201: llama_model_loader: - tensor 202: llama_model_loader: - tensor 203: llama_model_loader: - tensor 204: llama_model_loader: - tensor 205: llama_model_loader: - tensor 206: llama_model_loader: - tensor 207: llama_model_loader: - tensor 208: llama_model_loader: - tensor 209: llama_model_loader: - tensor 210: llama_model_loader: - tensor 211: llama_model_loader: - tensor 212: llama_model_loader: - tensor 213: llama_model_loader: - tensor 214: llama_model_loader: - tensor 215: llama_model_loader: - tensor 216: llama_model_loader: - tensor 217: llama_model_loader: - tensor 218: llama_model_loader: - tensor 219: llama_model_loader: - tensor 220: llama_model_loader: - tensor 221: llama_model_loader: - tensor 222: llama_model_loader: - tensor 223: llama_model_loader: - tensor 224: llama_model_loader: - tensor 225: llama_model_loader: - tensor 226: llama_model_loader: - tensor 227: llama_model_loader: - tensor 228: llama_model_loader: - tensor 229: llama_model_loader: - tensor 230: llama_model_loader: - tensor 231: llama_model_loader: - tensor 232: llama_model_loader: - tensor 233: llama_model_loader: - tensor 234: llama_model_loader: - tensor 235: llama_model_loader: - tensor 236: llama_model_loader: - tensor 237: llama_model_loader: - tensor 238: llama_model_loader: - tensor 239: llama_model_loader: - tensor 240: llama_model_loader: - tensor 241: llama_model_loader: - tensor 242: llama_model_loader: - tensor 243: llama_model_loader: - tensor 244: llama_model_loader: - tensor 245: llama_model_loader: - tensor 246: llama_model_loader: - tensor 247: llama_model_loader: - tensor 248: llama_model_loader: - tensor 249: llama_model_loader: - tensor 250: llama_model_loader: - tensor 251: llama_model_loader: - tensor 252: llama_model_loader: - tensor 253: llama_model_loader: - tensor 254: llama_model_loader: - tensor 255: llama_model_loader: - tensor 256: llama_model_loader: - tensor 257: llama_model_loader: - tensor 258: llama_model_loader: - tensor 259: llama_model_loader: - tensor 260: llama_model_loader: - tensor 261: llama_model_loader: - tensor 262: llama_model_loader: - tensor 263: llama_model_loader: - tensor 264: llama_model_loader: - tensor 265: llama_model_loader: - tensor 266: llama_model_loader: - tensor 267: llama_model_loader: - tensor 268: llama_model_loader: - tensor 269: llama_model_loader: - tensor 270: llama_model_loader: - tensor 271: llama_model_loader: - tensor 272: llama_model_loader: - tensor 273: llama_model_loader: - tensor 274: llama_model_loader: - tensor 275: llama_model_loader: - tensor 276: llama_model_loader: - tensor 277: llama_model_loader: - tensor 278: llama_model_loader: - tensor 279: llama_model_loader: - tensor 280: llama_model_loader: - tensor 281: llama_model_loader: - tensor 282: llama_model_loader: - tensor 283: llama_model_loader: - tensor 284: llama_model_loader: - tensor 285: llama_model_loader: - tensor 286: llama_model_loader: - tensor 287: llama_model_loader: - tensor 288: llama_model_loader: - tensor 289: llama_model_loader: - tensor 290: llama_model_loader: - tensor 291: llama_model_loader: - kv 0: llama_model_loader: - kv 1: llama_model_loader: - kv 2: llama_model_loader: - kv 3: llama_model_loader: - kv 4: llama_model_loader: - kv 5: llama_model_loader: - kv 6: llama_model_loader: - kv 7: llama_model_loader: - kv 8: llama_model_loader: - kv 9: llama_model_loader: - kv 10: llama_model_loader: - kv 11: llama_model_loader: - kv 12: llama_model_loader: - kv 13: llama_model_loader: - kv 14: llama_model_loader: - kv 15: llama_model_loader: - kv 16: llama_model_loader: - kv 17: llama_model_loader: - kv 18: llama_model_loader: - kv 19: llama_model_loader: - kv 20: llama_model_loader: - kv 21: llama_model_loader: - kv 22: llama_model_loader: - kv 23: llama_model_loader: - kv 24: llama_model_loader: - kv 25: llama_model_loader: - kv 26: llama_model_loader: - kv 27: llama_model_loader: - kv 28: llama_model_loader: - kv 29: llama_model_loader: - kv 30: llama_model_loader: - kv 31: llama_model_loader: - kv 32: llama_model_loader: - type f32: llama_model_loader: - type q4_K: llama_model_loader: - type q6_K: ERROR: byte not found in vocab: '
'
Traceback (most recent call last):
File "C:\Users\Admin\AppData\Local return self._context[key]
~~~~~~~~~~~~~^^^^^
KeyError: <class 'private_gpt.u t.settings.settings_loader - Starting application with profiles=['default', 'local']
t.components.llm.llm_component - Initializing the LLM in mode=llamacpp
CUDA devices:
RTX 3060, compute capability 8.6
meta data with 33 key-value pairs and 292 tensors from D:\privateGPT\models\Meta-Llama-3.1-8B-Instruct-Q4_K_M.gguf (version unknown)
rope_freqs.weight f32 [ 64, 1, 1, 1 ]
token_embd.weight q4_K [ 4096, 128256, 1, 1 ]
blk.0.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.0.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.0.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.0.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.0.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.0.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.0.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.0.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.0.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.1.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.1.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.1.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.1.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.1.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.1.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.1.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.1.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.1.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.2.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.2.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.2.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.2.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.2.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.2.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.2.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.2.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.2.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.3.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.3.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.3.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.3.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.3.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.3.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.3.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.3.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.3.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.4.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.4.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.4.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.4.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.4.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.4.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.4.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.4.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.4.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.5.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.5.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.5.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.5.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.5.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.5.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.5.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.5.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.5.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.6.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.6.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.6.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.6.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.6.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.6.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.6.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.6.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.6.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.7.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.7.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.7.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.7.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.7.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.7.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.7.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.7.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.7.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.8.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.8.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.8.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.8.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.8.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.8.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.8.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.8.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.8.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.10.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.10.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.10.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.10.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.10.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.10.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.10.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.10.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.10.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.11.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.11.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.11.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.11.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.11.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.11.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.11.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.11.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.11.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.12.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.12.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.12.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.12.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.12.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.12.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.12.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.12.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.12.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.13.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.13.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.13.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.13.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.13.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.13.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.13.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.13.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.13.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.14.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.14.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.14.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.14.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.14.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.14.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.14.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.14.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.14.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.15.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.15.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.15.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.15.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.15.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.15.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.15.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.15.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.15.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.16.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.16.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.16.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.16.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.16.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.16.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.16.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.16.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.16.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.17.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.17.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.17.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.17.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.17.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.17.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.17.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.17.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.17.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.18.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.18.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.18.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.18.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.18.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.18.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.18.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.18.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.18.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.19.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.19.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.19.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.19.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.19.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.19.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.19.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.19.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.19.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.20.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.20.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.20.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.20.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.20.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.9.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.9.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.9.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.9.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.9.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.9.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.9.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.9.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.9.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.20.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.20.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.20.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.20.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.21.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.21.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.21.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.21.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.21.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.21.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.21.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.21.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.21.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.22.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.22.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.22.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.22.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.22.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.22.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.22.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.22.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.22.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.23.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.23.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.23.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.23.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.23.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.23.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.23.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.23.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.23.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.24.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.24.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.24.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.24.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.24.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.24.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.24.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.24.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.24.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.25.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.25.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.25.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.25.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.25.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.25.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.25.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.25.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.25.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.26.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.26.ffn_down.weight q4_K [ 14336, 4096, 1, 1 ]
blk.26.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.26.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.26.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.26.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.26.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.26.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.26.attn_v.weight q4_K [ 4096, 1024, 1, 1 ]
blk.27.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.27.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.27.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.27.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.27.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.27.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.27.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.27.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.27.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.28.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.28.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.28.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.28.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.28.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.28.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.28.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.28.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.28.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.29.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.29.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.29.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.29.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.29.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.29.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.29.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.29.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.29.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.30.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.30.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.30.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.30.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.30.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.30.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.30.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.30.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.30.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
blk.31.ffn_gate.weight q4_K [ 4096, 14336, 1, 1 ]
blk.31.ffn_up.weight q4_K [ 4096, 14336, 1, 1 ]
blk.31.attn_k.weight q4_K [ 4096, 1024, 1, 1 ]
blk.31.attn_output.weight q4_K [ 4096, 4096, 1, 1 ]
blk.31.attn_q.weight q4_K [ 4096, 4096, 1, 1 ]
blk.31.attn_v.weight q6_K [ 4096, 1024, 1, 1 ]
output.weight q6_K [ 4096, 128256, 1, 1 ]
blk.31.attn_norm.weight f32 [ 4096, 1, 1, 1 ]
blk.31.ffn_down.weight q6_K [ 14336, 4096, 1, 1 ]
blk.31.ffn_norm.weight f32 [ 4096, 1, 1, 1 ]
output_norm.weight f32 [ 4096, 1, 1, 1 ]
general.architecture str
general.type str
general.name str
general.finetune str
general.basename str
general.size_label str
general.license str
general.tags arr
general.languages arr
llama.block_count u32
llama.context_length u32
llama.embedding_length u32
llama.feed_forward_length u32
llama.attention.head_count u32
llama.attention.head_count_kv u32
llama.rope.freq_base f32
llama.attention.layer_norm_rms_epsilon f32
general.file_type u32
llama.vocab_size u32
llama.rope.dimension_count u32
tokenizer.ggml.model str
tokenizer.ggml.pre str
tokenizer.ggml.tokens arr
tokenizer.ggml.token_type arr
tokenizer.ggml.merges arr
tokenizer.ggml.bos_token_id u32
tokenizer.ggml.eos_token_id u32
tokenizer.chat_template str
general.quantization_version u32
quantize.imatrix.file str
quantize.imatrix.dataset str
quantize.imatrix.entries_count i32
quantize.imatrix.chunks_count i32
66 tensors
193 tensors
33 tensors
\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 798, in get
i.ui.PrivateGptUi'>

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 798, in get
return self._context[key]
~~~~~~~~~~~~~^^^^^
KeyError: <class 'private_gpt.server.ingest.ingest_service.IngestService'>

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 798, in get
return self._context[key]
~~~~~~~~~~~~~^^^^^
KeyError: <class 'private_gpt.components.llm.llm_component.LLMComponent'>

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "", line 198, in run_module_as_main
File "", line 88, in run_code
File "D:\privateGPT\private_gpt_main.py", line 5, in
from private_gpt.main import app
File "D:\privateGPT\private_gpt\main.py", line 6, in
app = create_app(global_injector)
^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\privateGPT\private_gpt\launcher.py", line 66, in create_app
ui = root_injector.get(PrivateGptUi)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 91, in wrapper
return function(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 974, in get
provider_instance = scope_instance.get(interface, binding.provider)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 91, in wrapper
return function(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 800, in get
instance = self.get_instance(key, provider, self.injector)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 811, in get_instance
return provider.get(injector)
^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 264, in get
return injector.create_object(self.cls)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 998, in create_object
self.call_with_injection(init, self_=instance, kwargs=additional_kwargs)
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 1031, in call_with_injection
dependencies = self.args_to_inject(
^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 91, in wrapper
return function(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 1079, in args_to_inject
instance: Any = self.get(interface)
^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 91, in wrapper
return function(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 974, in get
provider_instance = scope_instance.get(interface, binding.provider)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 91, in wrapper
return function(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 800, in get
instance = self.get_instance(key, provider, self.injector)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 811, in get_instance
return provider.get(injector)
^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 264, in get
return injector.create_object(self.cls)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 998, in create_object
self.call_with_injection(init, self_=instance, kwargs=additional_kwargs)
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 1031, in call_with_injection
dependencies = self.args_to_inject(
^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 91, in wrapper
return function(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 1079, in args_to_inject
instance: Any = self.get(interface)
^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 91, in wrapper
return function(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 974, in get
provider_instance = scope_instance.get(interface, binding.provider)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 91, in wrapper
return function(*args, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 800, in get
instance = self.get_instance(key, provider, self.injector)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 811, in get_instance
return provider.get(injector)
^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 264, in get
return injector.create_object(self.cls)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init.py", line 998, in create_object
self.call_with_injection(init, self_=instance, kwargs=additional_kwargs)
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\injector_init_.py", line 1040, in call_with_injection
return callable(*full_args, **dependencies)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\privateGPT\private_gpt\components\llm\llm_component.py", line 63, in init
self.llm = LlamaCPP(
^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\llama_index\llms\llama_cpp\base.py", line 162, in init
self._model = Llama(model_path=model_path, **model_kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\llama_cpp\llama.py", line 357, in init
self.model = llama_cpp.llama_load_model_from_file(
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users\Admin\AppData\Local\pypoetry\Cache\virtualenvs\private-gpt-TFCUF6yI-py3.11\Lib\site-packages\llama_cpp\llama_cpp.py", line 498, in llama_load_model_from_file
return _lib.llama_load_model_from_file(path_model, params)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
OSError: exception: access violation reading 0x0000000000000000
make: *** [Makefile:36: run] Error 1`

Steps to Reproduce

make run

Expected Behavior

make run

Actual Behavior

make run

Environment

D:\privateGPT>poetry run pip list Package Version Editable project location ---------------------------------- --------------- ------------------------- aiofiles 23.2.1 aiohttp 3.9.5 aiosignal 1.3.1 annotated-types 0.7.0 anyio 4.4.0 attrs 23.2.0 beautifulsoup4 4.12.3 black 22.12.0 certifi 2024.7.4 cffi 1.16.0 cfgv 3.4.0 charset-normalizer 3.3.2 click 8.1.7 colorama 0.4.6 contourpy 1.2.1 coverage 7.6.0 cryptography 3.4.8 cycler 0.12.1 dataclasses-json 0.6.7 Deprecated 1.2.14 dirtyjson 1.0.8 diskcache 5.6.3 distlib 0.3.8 distro 1.9.0 dnspython 2.6.1 docx2txt 0.8 einops 0.8.0 email_validator 2.2.0 fastapi 0.111.1 fastapi-cli 0.0.4 ffmpy 0.3.2 filelock 3.15.4 fonttools 4.53.1 frozenlist 1.4.1 fsspec 2024.6.1 gradio 4.39.0 gradio_client 1.1.1 greenlet 3.0.3 grpcio 1.63.0 grpcio-tools 1.62.2 h11 0.14.0 h2 4.1.0 hpack 4.0.0 httpcore 1.0.5 httptools 0.6.1 httpx 0.27.0 huggingface-hub 0.24.3 hyperframe 6.0.1 identify 2.6.0 idna 3.7 importlib_resources 6.4.0 iniconfig 2.0.0 injector 0.21.0 itsdangerous 2.2.0 Jinja2 3.1.4 joblib 1.4.2 kiwisolver 1.4.5 llama_cpp_python 0.2.8+cu118 llama-index-core 0.10.58 llama-index-embeddings-huggingface 0.2.2 llama-index-llms-llama-cpp 0.1.4 llama-index-readers-file 0.1.31 llama-index-vector-stores-qdrant 0.2.14 markdown-it-py 3.0.0 MarkupSafe 2.1.5 marshmallow 3.21.3 matplotlib 3.9.1.post1 mdurl 0.1.2 minijinja 2.0.1 mpmath 1.3.0 multidict 6.0.5 mypy 1.11.0 mypy-extensions 1.0.0 nest-asyncio 1.6.0 networkx 3.3 nltk 3.8.1 nodeenv 1.9.1 numpy 1.26.4 openai 1.37.1 orjson 3.10.6 packaging 24.1 pandas 2.2.2 pathspec 0.12.1 pillow 10.4.0 pip 24.0 platformdirs 4.2.2 pluggy 1.5.0 portalocker 2.10.1 pre-commit 2.21.0 private-gpt 0.6.2 D:\privateGPT protobuf 4.25.4 pycparser 2.22 pydantic 2.8.2 pydantic_core 2.20.1 pydantic-extra-types 2.9.0 pydantic-settings 2.3.4 pydub 0.25.1 Pygments 2.18.0 pyparsing 3.1.2 pypdf 4.3.1 pytest 7.4.4 pytest-asyncio 0.21.2 pytest-cov 3.0.0 python-dateutil 2.9.0.post0 python-dotenv 1.0.1 python-multipart 0.0.9 pytz 2024.1 pywin32 306 PyYAML 6.0.1 qdrant-client 1.10.1 regex 2024.7.24 requests 2.32.3 rich 13.7.1 ruff 0.5.5 safetensors 0.4.3 scikit-learn 1.5.1 scipy 1.14.0 semantic-version 2.10.0 sentence-transformers 3.0.1 setuptools 72.1.0 shellingham 1.5.4 six 1.16.0 sniffio 1.3.1 soupsieve 2.5 SQLAlchemy 2.0.31 starlette 0.37.2 striprtf 0.0.26 sympy 1.13.1 tenacity 8.5.0 threadpoolctl 3.5.0 tiktoken 0.7.0 tokenizers 0.19.1 tomlkit 0.12.0 torch 2.4.0 tqdm 4.66.4 transformers 4.43.3 typer 0.12.3 types-PyYAML 6.0.12.20240724 typing_extensions 4.12.2 typing-inspect 0.9.0 tzdata 2024.1 ujson 5.10.0 urllib3 2.2.2 uvicorn 0.30.3 virtualenv 20.26.3 watchdog 4.0.1 watchfiles 0.22.0 websockets 11.0.3 wrapt 1.16.0 yarl 1.9.4

Additional Information

D:\privateGPT>poetry run pip check llama-index-llms-llama-cpp 0.1.4 has requirement llama-cpp-python<0.3.0,>=0.2.32, but you have llama-cpp-python 0.2.8+cu118.

Version

latest

Setup Checklist

Confirm that you have followed the installation instructions in the project’s documentation.
Check that you are using the latest version of the project.
Verify disk space availability for model storage and data processing.
Ensure that you have the necessary permissions to run the project.

NVIDIA GPU Setup Checklist

Check that the all CUDA dependencies are installed and are compatible with your GPU (refer to CUDA's documentation)
Ensure an NVIDIA GPU is installed and recognized by the system (run nvidia-smi to verify).
Ensure proper permissions are set for accessing GPU resources.
Docker users - Verify that the NVIDIA Container Toolkit is configured correctly (e.g. run sudo docker run --rm --gpus all nvidia/cuda:11.0.3-base-ubuntu20.04 nvidia-smi)

The text was updated successfully, but these errors were encountered:

linhcentrio added the bug Something isn't working label Aug 16, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[BUG] ERROR: byte not found in vocab: #2061

[BUG] ERROR: byte not found in vocab: #2061

linhcentrio commented Aug 16, 2024

[BUG] ERROR: byte not found in vocab: #2061

[BUG] ERROR: byte not found in vocab: #2061

Comments

linhcentrio commented Aug 16, 2024

Pre-check

Description

Steps to Reproduce

Expected Behavior

Actual Behavior

Environment

Additional Information

Version

Setup Checklist

NVIDIA GPU Setup Checklist