-
Notifications
You must be signed in to change notification settings - Fork 3
/
Copy pathtahmin_dosya_json.py
84 lines (68 loc) · 3.01 KB
/
tahmin_dosya_json.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
#! -*- coding: UTF-8 -*-
"""
Yapay Zeka modeli EncDenseModel sınıfı ile inşa edilip ağırlıklar yüklenir,
1. argüman olarak verilen dosya isminden sorular okunarak, 2. argüman olarak verilen dosya adıyla cevap çıktıları verilir.
"""
import sys
assert sys.argv[1]
girdi_dosyaAdi = sys.argv[1]
try:
cikti_dosyaAdi = sys.argv[2]
except IndexError:
cikti_dosyaAdi = "cevaplar.json"
import tensorflow as tf
import numpy as np
import random, json
from EncDenseModel import EncDenseModel
from utils import *
# Parametreler okunur.
hParams = parametre_yukle("model.json")
bucket_yapi, veri_sayisi = parametre_hazirla(hParams, "veri/tum_veri.txt")
cevaplar = [ikili.split("\t")[1] for ikili in filtrele(open("veri/tum_veri.txt", "r", encoding="utf-8").read().split("\n"))]
cevap_sayisi = len(cevaplar)
# Embedding modelleri yüklenir.
# Eğitim sırasında FastText modelinden ayıklanmış olan vektörler kullanılır.
# Test ve çıktı sırasında direkt olarak FastText modeli kullanılır.
model_embedding, embedding_matris = embedding_yukle_kv("model/EmbeddingMatrisPre_kv", hParams)
model_embedding_pre = embedding_yukle_fasttext("model/EmbeddingFastText_TR")
# EncDenseModel sınıfı tanımlanır.
model = EncDenseModel(
mod="dene",
hParams=hParams,
embedding_matris=embedding_matris,
cevap_sayisi=cevap_sayisi,
sess_cfg=None
)
# Model inşa edilir ve eğer ağırlık varsa yüklenir.
model.insa_et()
model.yukle("model/Agirliklar", True)
# JSON girdi dosyası okunur.
sorular_girdi = json.loads(open(girdi_dosyaAdi, "r", encoding="utf-8").read())
for m_i in range(0, len(sorular_girdi["veri"])):
for pr_i in range(0, len(sorular_girdi["veri"][m_i]["paragraflar"])):
for sc_i in range(0, len(sorular_girdi["veri"][m_i]["paragraflar"][pr_i]["soru_cevaplar"])):
soru = sorular_girdi["veri"][m_i]["paragraflar"][pr_i]["soru_cevaplar"][sc_i]["soru"]
# Girdi temizlenerek matrise çevrilir.
inp = girdi_cikti_temizle(soru).strip()
enc_x = cumle_matris(hParams, inp, model_embedding_pre)
# Çevrilen matris modele verilerek çıktı verilir.
_output = model.tahmin_et_infer(enc_x)
_output = cevaplar[np.argmax(_output[0])]
paragraf_metni = girdi_cikti_temizle(sorular_girdi["veri"][m_i]["paragraflar"][pr_i]["paragraf_metni"])
try:
_cevap_indeks = paragraf_metni.index(_output)
_cevap_indeks = paragraf_metni[:_cevap_indeks].count(" ")
except:
_cevap_indeks = 0
print(soru.title())
print(_output.title())
print(_cevap_indeks)
print("______________________")
# JSON dosyasındaki doldurulması gereken yerleri doldur.
sorular_girdi["veri"][m_i]["paragraflar"][pr_i]["soru_cevaplar"][sc_i]["cevap"] = _output.title()
sorular_girdi["veri"][m_i]["paragraflar"][pr_i]["soru_cevaplar"][sc_i]["cevap_baslangici"] = _cevap_indeks
# Düzenlenen JSON yapısını dosyaya yazdır.
sorular_cikti_json = json.dumps(sorular_girdi, indent=4, ensure_ascii=False)
sorular_cikti_jsonF = open(cikti_dosyaAdi, "w", encoding="utf-8")
sorular_cikti_jsonF.write(sorular_cikti_json)
sorular_cikti_jsonF.close()