From 7eb80ddb73d670a314a0a61e22ed12d37495cf4c Mon Sep 17 00:00:00 2001
From: "suherdy.yacob@mapan.co.id" <suherdy.yacob@mapan.co.id>
Date: Fri, 30 May 2025 14:11:01 +0700
Subject: [PATCH] fix some bug

---
 config.ini                                    |   2 +-
 main.py                                       |   2 +-
 main2.py                                      |   2 +-
 main3.py                                      |   2 +-
 output/Candra mas.MP3.txt                     |   0
 output/Candra mas_113350_id.txt               |  11 ++++++++
 output/REC20250526103049.WAV.txt              |   0
 .../convert_to_mono.cpython-312.pyc           | Bin 1683 -> 2673 bytes
 .../__pycache__/core_analysis.cpython-312.pyc | Bin 5303 -> 5303 bytes
 .../__pycache__/wav_segmenter.cpython-312.pyc | Bin 1657 -> 1692 bytes
 .../write_log_file.cpython-312.pyc            | Bin 1487 -> 1404 bytes
 speechlib/convert_to_mono.py                  |  25 +++++++++++++++++-
 speechlib/wav_segmenter.py                    |   2 +-
 speechlib/write_log_file.py                   |   3 ++-
 14 files changed, 42 insertions(+), 7 deletions(-)
 create mode 100644 output/Candra mas.MP3.txt
 create mode 100644 output/Candra mas_113350_id.txt
 create mode 100644 output/REC20250526103049.WAV.txt

diff --git a/config.ini b/config.ini
index d61badb..517dfd5 100644
--- a/config.ini
+++ b/config.ini
@@ -8,4 +8,4 @@ voicefolder = D:\Pythoncode\speechlib\voices
 beamsize = 5
 batchsize = 4
 accesstoken = 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
-quantization = False
\ No newline at end of file
+quantization = True
\ No newline at end of file
diff --git a/main.py b/main.py
index a995f6f..8600bcd 100644
--- a/main.py
+++ b/main.py
@@ -38,6 +38,6 @@ for filename in os.listdir(audio_dir):
         filename = open(filepath, "w")
 
         ### transcribe ###
-        transcriptor = Transcriptor(audiofile, output_dir, language, modelSize, access_token, voicefolder, quantization)
+        transcriptor = Transcriptor(audiofile, filepath, language, modelSize, access_token, voicefolder, quantization)
         res = transcriptor.faster_whisper()
         
\ No newline at end of file
diff --git a/main2.py b/main2.py
index acddd31..4e33d07 100644
--- a/main2.py
+++ b/main2.py
@@ -48,7 +48,7 @@ if st.button("Transcribe"):
             #filepath = os.path.join(outputfolder, os.path.basename(audiofilewithoutextension).split('/')[-1]+".txt")
             filepath = os.path.join(outputfolder, f"{outlet}-{crew_id}-{crew_name}-{date}-Transkrip.txt")
             print(f"Output file: {filepath}")
-            filename = open(filepath, "w")
+            #filename = open(filepath, "w")
 
             ### transcribe ###
             transcriptor = Transcriptor(path, filepath, language, modelSize, access_token, voicefolder, quantization)
diff --git a/main3.py b/main3.py
index 63b6c98..1e084f3 100644
--- a/main3.py
+++ b/main3.py
@@ -44,7 +44,7 @@ if st.button("Transcribe"):
             #filepath = os.path.join(outputfolder, os.path.basename(audiofilewithoutextension).split('/')[-1]+".txt")
             filepath = os.path.join(outputfolder2, f"{crew_id}-{crew_name}-{customer_name}-{date}-Transkrip.txt")
             print(f"Output file: {filepath}")
-            filename = open(filepath, "w")
+            #filename = open(filepath, "w")
 
             ### transcribe ###
             transcriptor = Transcriptor(path, filepath, language, modelSize, access_token, voicefolder, quantization)
diff --git a/output/Candra mas.MP3.txt b/output/Candra mas.MP3.txt
new file mode 100644
index 0000000..e69de29
diff --git a/output/Candra mas_113350_id.txt b/output/Candra mas_113350_id.txt
new file mode 100644
index 0000000..57726aa
--- /dev/null
+++ b/output/Candra mas_113350_id.txt	
@@ -0,0 +1,11 @@
+WATI (2.1 : 3.3) :  See ya. 
+WATI (6.3 : 9.9) :  dari mapan cik mau kunjungan 
+WATI (10.6 : 14.3) :  Oh iya silahkan masuk mbak. Tak cek dulu ya cik ya. 
+WATI (15.3 : 17.7) :  Kita hitung dulu stoknya. 
+WATI (18.6 : 20.2) :  Terima kasih. 
+WATI (21.6 : 38.1) :  yang layan nih pesan-pesan tok ya cik ya onan-onan hujan terus ya hujan angin ini tinggal berapa itunya apa kemarin somek udang ya somek udang sama 
+DWI (27.9 : 29.5) :  Terima kasih. 
+WATI (38.7 : 40.0) :  itunya sampean 
+WATI (44.2 : 45.7) :  Minya tinggal satu lho, Ci. 
+WATI (46.7 : 47.7) :  Kita hitung ya. 
+WATI (51.1 : 52.8) :  Mbak helmnya diambil aja. 
diff --git a/output/REC20250526103049.WAV.txt b/output/REC20250526103049.WAV.txt
new file mode 100644
index 0000000..e69de29
diff --git a/speechlib/__pycache__/convert_to_mono.cpython-312.pyc b/speechlib/__pycache__/convert_to_mono.cpython-312.pyc
index ebed5bac5655ed50e4cb2828d068a1ed93820e18..d8e2e4da27613ff6648aa05e66872873ec8de75a 100644
GIT binary patch
literal 2673
zcmb7GO>7%Q6rNe{I%_*lY%777B+ZsKaTAD3p!_syN=(}zXq)~Z3W+L38_y=Tv3Jex
zI;o9~Dg;uHkVsESg{t@%lu85%i5#gAy}-eiQyFbJR3ew&0;v=f4)A8}jg0{zUgVkg
z-n^fgH}k&D_incn0VO7mM?Pvo=w~We#8jD`Bfu;nf(VYI$;yl;8B?}RvV{2%O>)Er
zqdkrL*@x6^JZyPW2_hpK{B{a3EFlNdF)${@>g}q!ELy9sUxn2ile5*?vsI(IDT}jA
z*0x470AZxld?pc`MV}$UWHF4kTbvaaqcnF2>AYok7^xjOw$6{uvY(+_OwE1*5iZBR
z&!)M`JdfwmHQNN5$Nl!q+Broenjp%8m?BX{n2E+Ekcgm4nm8wELR1erodQruoz;d-
zj!IEEnbN0B>m!=3_74jeMLi<uil9fN%4%K2;J%-d(*Mno<}<x3smb5`GY8*Dg~O7j
z&7|V-bajXOW~!190vUUN?jf*;1DTF9s;a0$QdOu=RGzH_92Um=IfKz=3|5syVsP_n
zRF@1csYYepaGbdomXdl@k-^AWJEh^O+quCKQ5OxTCMJ?`Nfp5zOBx4PLQ5m;9XmaI
z^<r9&C~{aK(p4=fN#RI5I$g(w6?sll^(kGMN+_}tOs0+I%DJb^i%>lf%?>{;0>gE*
z-QwVaTb<o2FW!7HKV0ez7Ws|^b|Lo2jvTH}`H%U<&SjE+eUm@>6Ynl~hSmqxyEd+T
zbM~8&!o^F4mdp3}H-6i4wf%}P7c?!7ta?{%g_ftw{9utE{C(R73wv4zB>NzQLoB+(
zIzqj+JMNZ{V7nu5z=!u=J{Zy7Gy7r`#-+Nh$f7KYRo^q%>=VJ(izJL6w8WNyajn`z
z_<wojkWPzjQj8X<fwG9OR^;bV4rg)9(O?4NT2+-}vP{gxlE2yz?w!*JEn=1WyZ^dI
zC1STu1YO>0t;guaHBi>3w^*u}&*EzH?Ivrt(8;w(Z8Zyv%d)Y@ExtAr`#+z+ib}ZK
zyv66Z|E!(EvW42&v-TLht_C6;WPGAQ2_k5_{;t(~EM0aV$G}psw6z(uPu3)ho7t~4
zyc2t@*V5PKx~ly{eQQ~*8^iQl0Dsm=0eJ&fG!u87^$04rG_1PnR~sXx(IGU1G(68>
zGy#~7(I-bMc-yE?TR7Z2zK4S<?S%|Kl?*3>^WvPrsM8N=%RT%9s2>{~(bGu@7*@O%
z)eL5SI^z?nI3f`WdlX4B2ZSi#d7NTfS`bZLJ(Bjfnb2ZzS~4Eh4Hhy<2CF0`*>KEC
zdQw!ygl0J8a72`4DXtk#8fgZ!66BPVhI0mxb~-gPBdG=lkU8{%!6qb8HktsxB4Sc9
z99k_7g~<6R(IbY#jA4SMEe_fEu#!m96ID1F5*RKMiz~@g`ibjrG8`2UhJC8ENez2-
zi}vcCoF-mQnTXs<D^LMYQ=z)RL!;kR6PN`-rQKz;HlVNi3}`9zX*nqPb+pBL7X8bw
ztz5WyVf9q0>zQ?LvFo|@Sg~t#lMVgo@h`RBXwBP7p2PV|MNeRLpy)Yv{k1KJ`&0kN
z{>9_Vq~tiXjUMMlaX$0F+gbMZ7QMYCZ(zZ`ZAZ<%va7S`>Rc8}uAT?&J>~X+V*9}A
zv!(Xn!q`v#&Xw+)-TAq%E`R;@mv3+SPcFO;2;XyXW%lN5K348~so3|@hHv9adE|U?
z<b0`byzu6g%>!>OTmUQIV@v)U{^jF&Qu02vjX3uyy!ze)PiNWFTlDni-(Br14-6Lv
zhBwB_C(ad5ockeMxGa{&rwb%jCR&kbh17ey2+iR$%rBK`8==4$^9UjDs|;-2+g0`i
z;J~+;FZj>-^`6p^(5B~=T^G&ts0F!wixZ1y3q3;x-?R6cpWABoR^*X_@8o9l%ezNu
zMJjdK?V>)FJ?`yx*B17)KDdTEt*;yyYqNbj7#bYox$mCn1>r8wjd>k+-A$Bl<How1
z`kPdWKn5qL63MhmF$SKVl9CDiw?w612=l3%xBEHT0U4S1zsH|QC?pk^PO8s?j`o;F
fF%G_g7~e;(`^fh*dhA!$gM&MVyYMJhkHPAnPB~-R

delta 829
zcmZuv%Wo1v7@yhM*=3>7f?`UgEeJ$O#YbY}BgR-Q9^0!SCTKb|vcfJ|7O=@;J$Ug{
z$Q)|Yc<|uC(35|Hu_rGadfJ{$ym-@asNv*Hx0A)hFPZ&*k8i$t?EF4U!;x>{a1gL)
z8@HZ+miv*}l{v<C0RaToK*`InBoXNiD4{KwM?ZP_+6Lt5G<XNZ#%L(9x&2N$M&N)!
z9?PH$9jIe^O<vqqJZ<tzq!+6I^q|G7v`NRq1PxA?>LNQNe0@qFKRd`iISN<wh_4H@
zFHeb0b!9t5d-D84SwACeKNI9g`hT`6W)o>23*5#1m#L>j5u6=YaTGo7cN2(6tm`?!
z{LIu@p9y527s$Z_NP9Rbv%&@H;`Cx#Sbm<knFyUzZWc1abHE-T>U&AtA_PXn{?`rA
zSIWAit<mqwV;G~4)V-988&=h@^Qx;=jYi8Zcb>J~pa(arwF>>C78c!**|NFGm8Qy8
zOnEWBv3lo8gMN^%Uzy%8jdsPd%eGmrn}%s+S((g6^D6tTufY#3ypwpF=-qxt4z&#Z
z80etG=n~Con+U`%(;Y3l4T9OBmN`x`K8!AnkLNvM+|02yyAKwMN%UoTrBIx~UoYes
zIheu4gmw^DIZonYPR+{}e;F<|TJ^@3HO=tJK0bjFgTUg~;Rf#3P134W?pc=@<!`PT
YWuISh1R*>Ep(79*$q9HLS{Ir87p&HdzW@LL

diff --git a/speechlib/__pycache__/core_analysis.cpython-312.pyc b/speechlib/__pycache__/core_analysis.cpython-312.pyc
index f66b136de331fa261b15e903be51ad7510a0fa26..47d38706b19169f555924a68c455a6d89ffb9a98 100644
GIT binary patch
delta 19
Zcmdn4xm}a%G%qg~0}zBpY~)%i0su6s1mgez

delta 19
Zcmdn4xm}a%G%qg~0}zBNZRA=j0su3d1g!u7

diff --git a/speechlib/__pycache__/wav_segmenter.cpython-312.pyc b/speechlib/__pycache__/wav_segmenter.cpython-312.pyc
index a3a7205d07caca5a2d93562648aa2ed1b625abdb..fb1e46bb0d323535160ab9f8d18cdcc833f9a987 100644
GIT binary patch
delta 282
zcmey#Gl!S=G%qg~0}x#BvCOzWk+*}<ZQ`^IjLRmwGdf9R@q%PfK@CF||KyE~!jl&;
z3NV6LN_?vsAxf%%REgl^yNrrJ>HmzXjG~iOnN%6YCwns)O0QsHsNoJ~P-ZBRfElR5
zP$X6>Tp~SrI+Hx((aGDH9J#rQQ`2)(^GbB9YbP@@>oM|8Hel9aE#d%b*&M?h!^r48
zc_&M^qs?_?vx~}R8!ETgZ>&F1a@pMHM9@X^fa~UA7tO;ighyRAkG>ESd(k}ZvU2=I
z{`f12DHl@HE+?j6<WIklRdA8NU~(gChnS#_3nSAJMot$6)+1azF4C+=q*+}QCd;!$
F0RV|LPkR6W

delta 246
zcmbQk`;&+FG%qg~0}y<Yv&=X@k+*|UZ{oBKjI$=YGdi)<Fl6ygUdX7-2qJ|i-(ckD
zn$0kmsS2pPgn#l^Mny)!$>L0^Kq*@wDLOfs$xwO@3quWeFoQBfi5SRO5Kv(#5~~$1
zk(|7qNuF`%<nv69oE*ie>A9(SCAyQPne~9idok;5u4ay5WOSc=gQeRxVnycq{FV7T
zQZDN`A8@*;=YCz!_oANfiR8<AK^KBUF6xC|&<(qw9Db2M{7PiZh1j^uk?|M#<1Zv-
nT;$J~yo9wwj8(_kl<BZ3r;7;dVLKide%2%WtS%yxo!FuP%HB)5

diff --git a/speechlib/__pycache__/write_log_file.cpython-312.pyc b/speechlib/__pycache__/write_log_file.cpython-312.pyc
index f59ae70fb04af0a94c7de8454b5797d109fa94c0..5ae8d00230b27b7e605a10102bb9e2bbd5b22de8 100644
GIT binary patch
delta 287
zcmX@l{fCS9G%qg~0}xE}wamCWkvEmmXk)Q4qf9Mpi7-eQ1Zr4Qm{&7F*tKjaER)|b
zO8T-&0tIThYB*BZz$|Vciyh43so_px$u?(TC}!-D1+p2SY~>pE8lKq<DI7JNK$5eD
z3rKR+a05y1$w5rcj69R4G1>C-`c<*1dZ_xU1{Z;>-29G7laVoCvIL6*w;GVo0>s7t
z7$zsPBq)4fV-S#P@OZ+`-Qh7I<TATdgVO^Zz6RF^!b+bQ*jeo-u|_Zhsmal-x@z1&
qeMQV50%Xcch9Y$kTNOzB;;_lhPbtkwwJXw`ypC0pLxzzbEDHc1rawpk

delta 370
zcmeyvb)K8|G%qg~0}zzuS!C>-$eYR-v$5Eiu|9>l3Mg2^1R_&dz-%xHWrJl?SV7{o
ztR=!g3JhvkQ`lBBLD;oyDeSfEH4H8cvBp4E95oy%Op-vUT23H~1I*$AvN*vkZXk;b
z%;KrxPGQfU{F_lqn7f8^HbV+e4HuB)t>Ffee3LbpoEiBi=P=ny3;0#Bsd}jTss<N<
zY`n#&e~U4`ibb!aqGa<9CQU}hg2|7V9k?}sax6exEX_DsmnFgW0l(x7=ZpOE3p6kC
zYp+PY$Zxp8=OVwu0ppAOZYLxz@&{fBiMq%i)!^}jox8(hLda!ysRpM9JbVqVkA;;c
zuVsl~W)M-H%)zRw#tSsHh#5qH>{!WAqzPiH1BqK4Ho5sJr8%i~McR|2StU878TrAo
E09Phe_y7O^

diff --git a/speechlib/convert_to_mono.py b/speechlib/convert_to_mono.py
index 4d6b02b..f61a25c 100644
--- a/speechlib/convert_to_mono.py
+++ b/speechlib/convert_to_mono.py
@@ -1,8 +1,31 @@
 import wave
 import numpy as np
 
+import soundfile as sf
+
+def resave_audio(input_file, output_file):
+    """Loads an audio file and resaves it.
+
+    Args:
+        input_file (str): Path to the input audio file.
+        output_file (str): Path to save the resaved audio file.
+    """
+    try:
+        # Read the audio file
+        data, samplerate = sf.read(input_file)
+
+        # Write the audio data to a new file
+        sf.write(output_file, data, samplerate)
+        print(f"Successfully resaved audio from '{input_file}' to '{output_file}'")
+
+    except Exception as e:
+        print(f"Error processing audio: {e}")
+
 def convert_to_mono(input_wav):
-    # Open the input WAV file
+    # Resave WAV file
+    resave_audio(input_wav, input_wav.split('.')[0] + "_pcm.wav")
+    input_wav = input_wav.split('.')[0] + "_pcm.wav"
+
     with wave.open(input_wav, 'rb') as input_file:
         # Get the parameters of the input file
         params = input_file.getparams()
diff --git a/speechlib/wav_segmenter.py b/speechlib/wav_segmenter.py
index bef461a..699be2c 100644
--- a/speechlib/wav_segmenter.py
+++ b/speechlib/wav_segmenter.py
@@ -23,7 +23,7 @@ def wav_file_segmentation(file_name, segments, language, modelSize, model_type,
         end = segment[1] * 1000     # end time in miliseconds
         clip = audio[start:end]
         i = i + 1
-        file = folder_name + "/" + f"segment-{file_name.split("\\")[-1].split(".")[0]}"+ str(i) + ".wav"
+        file = folder_name + "/" + "segment-{}".format(file_name.split('\\')[-1].split(".")[0])+ str(i) + ".wav"
         clip.export(file, format="wav")
 
         try:
diff --git a/speechlib/write_log_file.py b/speechlib/write_log_file.py
index 0a18c8b..22a0e9e 100644
--- a/speechlib/write_log_file.py
+++ b/speechlib/write_log_file.py
@@ -12,7 +12,8 @@ def write_log_file(common_segments, log_folder, file_name, language):
 
     file_name = os.path.splitext(os.path.basename(file_name))[0]
 
-    log_file = log_folder + "/" + file_name + "_" + current_time + "_" + language + ".txt"
+    #log_file = log_folder + "/" + file_name + "_" + current_time + "_" + language + ".txt"
+    log_file = log_folder
     
     lf=open(log_file,"wb")