Cara Membuat Alur Kerja Pemrosesan Invoice Otomatis
Pemrosesan faktur otomatis adalah proses mengekstraksi data secara mulus dari faktur yang masuk ke sistem Anda dan memasukkannya ke dalam ERP Anda sehingga pemrosesan pembayaran dapat dilakukan hanya dengan beberapa klik. Blog ini adalah ikhtisar komprehensif tentang teknologi terbaru yang memungkinkan Anda melakukan itu.

Memproses pembayaran untuk departemen keuangan adalah proses yang kacau dengan faktur yang berasal dari setiap format yang memungkinkan: faktur kertas, PDF, PDF yang dipindai, email, dll. Volume juga berfluktuasi dengan musim di mana puncaknya menjadi sangat sibuk bagi personel keuangan. Pengambilan faktur menggunakan entri data manual ke dalam sistem selama waktu ini menyebabkan masalah umum seperti dokumen yang hilang dan ketidakcocokan penghitungan.
Di blog ini kita berbicara tentang seperti apa sistem pemrosesan faktur otomatis yang ideal dan apa pro dan kontra dari sistem semacam itu.
Lihat juga OCR Faktur Nanonets yang telah dilatih sebelumnya atau buat alur kerja manajemen Faktur kustom Anda sendiri.
Perangkat Lunak Otomasi Faktur
Siklus Procure to Pay biasanya melibatkan langkah-langkah berikut:

Ada 3 langkah dalam setiap pemrosesan faktur:
– Memindai fisik faktur
– Menafsirkan data invoice sesuai aturan bisnis
– Pengarsipan data ke dalam ERP apapun
Sekarang ada dua jenis perangkat lunak pengolah faktur di pasar:
- Perangkat lunak OCR berbasis aturan seperti Kofax, Tipalti, Abby
- Perangkat lunak OCR cerdas seperti Nanonets, Rossum
Perangkat lunak harus secara cerdas mengekstrak informasi yang diperlukan dan memvalidasinya sesuai dengan aturan bisnis seperti pemetaan ke nomor pesanan Pembelian sebelum memasukkan detail akhir ke dalam ERP untuk pemrosesan pembayaran. Sistem berbasis aturan tidak dapat diskalakan dengan baik karena bisnis terus menambah/mengaduk vendor dan menulis aturan baru setiap kali merupakan proses yang tidak efisien.
Perangkat lunak ini juga menawarkan integrasi dengan sebagian besar perangkat lunak ERP seperti SAP, Oracle, Microsoft Dynamics 365.
Alur Kerja Pemrosesan Faktur Otomatis

Perangkat lunak pemrosesan faktur otomatis apa pun perlu menjalankan pencocokan 3 arah dari pesanan pembelian, faktur yang diterima terhadap pesanan pembelian, dan tanda terima yang dihasilkan terhadap faktur. Setiap dokumen ini memiliki nomor unik yang perlu dipetakan satu sama lain.
Berikut adalah contoh alur pemrosesan faktur otomatis:
- Faktur tiba di folder email tertentu sebagai lampiran (JPEG, PDF, EDI, PNG dll)
- Dokumen masuk di bawah tab “Tinjau”.
- Perangkat lunak otomatisasi faktur mengekstrak data dari lampiran
- Validasi data faktur vendor yang diekstraksi dengan aturan bisnis dari file Master Vendor
- Jika nilai yang diekstraksi lulus semua aturan validasi, pindah ke “Terverifikasi”
- Jika nilai yang diekstraksi tidak lulus aturan validasi, dokumen tetap berada di bagian “Tinjau” kecuali ditinjau secara manual dan dipindahkan ke “Terverifikasi”
- Laporan akhir dihasilkan yang berisi semua data faktur
- Ekspor sebagai .csv atau integrasikan API dengan sistem ERP
Tangkapan Kognitif Faktur

Menggunakan kemajuan terbaru dalam kecerdasan buatan ditambah dengan pengurangan biaya komputasi, solusi OCR faktur Nanonet mampu menangkap data faktur apa pun formatnya. Anda tidak perlu lagi mengatur aturan

Ekstraksi Tabel
Ini adalah fase di mana informasi diekstraksi setelah tabel diidentifikasi. Ada banyak faktor mengenai bagaimana konten disusun dan konten apa yang ada dalam tabel. Oleh karena itu, penting untuk memahami semua tantangan sebelum membangun algoritme.
- Konten Padat: Konten sel dapat berupa numerik atau tekstual. Namun, konten tekstualnya biasanya padat, berisi potongan teks pendek yang ambigu dengan penggunaan akronim dan singkatan. Untuk memahami tabel, teks perlu didisambiguasi, dan singkatan serta akronim perlu diperluas.
- Font dan Format Berbeda: Font biasanya memiliki gaya, warna, dan tinggi yang berbeda. Kami perlu memastikan bahwa ini umum dan mudah diidentifikasi. Beberapa keluarga font terutama yang termasuk kursif atau tulisan tangan, agak sulit untuk diekstraksi. Oleh karena itu, menggunakan font yang bagus dan pemformatan yang tepat membantu algoritme untuk mengidentifikasi informasi dengan lebih akurat.
- Beberapa Halaman PDF dan Hentian Halaman: Baris teks dalam tabel peka terhadap ambang yang telah ditentukan sebelumnya. Juga dengan rentang sel di beberapa halaman, menjadi sulit untuk mengidentifikasi tabel. Pada halaman multitabel, sulit untuk membedakan tabel yang berbeda satu sama lain. Tabel yang jarang dan tidak beraturan sulit untuk dikerjakan. Oleh karena itu, garis pengatur grafik dan tata letak konten harus digunakan bersama sebagai sumber penting untuk menemukan wilayah tabel.
Manfaat
- Biaya: Kurangi penekanan tombol sebenarnya hingga hampir 90% dan manfaatkan diskon untuk pembayaran lebih awal
- Produktivitas: Dengan menghapus manual tugas entri data yang melelahkan, tim keuangan Anda melakukan tugas yang lebih penting 75% lebih cepat
- Analitik: Dengan menggunakan mesin, Anda sekarang dapat mengekstraksi lebih banyak data dengan lebih cepat yang mengarah ke analitik mendalam ke dalam inefisiensi dan kemacetan proses bisnis
- Lokal: Kami memahami bahwa ini adalah data sensitif untuk bisnis Anda. Perangkat lunak Nanonets AP Automation dapat berjalan di tempat
Evolusi dari proses penagihan
Proses meninjau faktur telah banyak berkembang dari waktu ke waktu. Pertumbuhan teknologi telah melihat proses pemrosesan faktur bergerak melalui tiga fase utama.
Fase 1: Peninjauan Manual
Pertimbangkan kasus penggunaan di mana organisasi sedang melalui proses penggantian biaya vendor regulernya untuk biaya bulan itu.
Langkah-langkah berikut diikuti untuk memproses faktur –
- Orang-orang diharapkan untuk menyerahkan beberapa faktur secara langsung ke kontak organisasi yang bersangkutan.
- Orang ini pada gilirannya akan meneruskan semua faktur ke peninjau yang akan meninjau setiap dokumen secara keseluruhan. Ini termasuk menuliskan atau memasukkan setiap detail ke dalam perangkat lunak seperti nama orang yang melakukan pembelian, nama toko asal pembelian, tanggal dan waktu pembelian, barang yang dibeli, biayanya, diskon, dan pajak.
- Jumlah total dari setiap faktur dihitung, sekali lagi secara manual atau jika perangkat lunak entri data dirancang khusus untuk tujuan akuntansi, menggunakan perangkat lunak tersebut.
- Tagihan / tanda terima akhir dibuat dengan angka akhir dan pembayaran diproses.
Fase 2: Pemindaian Invoice dan Peninjauan Manual
Dengan munculnya teknik OCR, banyak waktu yang dihemat dengan mengekstraksi teks dari gambar digital dari invoice atau dokumen apa pun secara otomatis. Di sinilah sebagian besar organisasi yang menggunakan OCR untuk segala bentuk otomatisasi saat ini.

- Salinan digital invoice diperoleh dengan memindai faktur atau mengambil gambar menggunakan kamera.
- Teks diekstraksi dari invoice ini menggunakan OCR. Ini mampu menyediakan teks digital yang membuat entri data sedikit lebih mudah. Namun masih banyak pekerjaan yang harus dilakukan secara manual.
- Hasil OCR dari setiap invoice harus diurai dengan tepat untuk menemukan data yang relevan dan membuang data yang tidak relevan.
- Setelah ini selesai, data harus dimasukkan ke dalam perangkat lunak yang menyediakan templat bagi peninjau untuk mempermudah tugasnya. Template ini unik untuk setiap kasus penggunaan, organisasi, dan sebagian besar untuk setiap jenis faktur yang berbeda. Sementara proses OCR membantu pemrosesan invoice, itu tidak menyelesaikan banyak bagian yang membosankan karena hasil OCR yang tidak terstruktur.
- Data yang dimasukkan dimasukkan melalui tinjauan manual untuk memperbaiki kesalahan. Proses ini memakan waktu lama karena melewati banyak peninjau karena kinerja yang buruk dari alat OCR yang tersedia saat ini.
- Terakhir, perhitungan selesai dan rincian pembayaran diteruskan ke bagian keuangan.
Bagaimana cara mendigitalkan faktur dengan lebih baik?
Dengan menggunakan OCR dan pembelajaran mendalam, kami telah memungkinkan mesin bekerja dengan baik dan dalam beberapa kasus bahkan lebih baik daripada manusia.
Mendigitalkan faktur melibatkan beberapa langkah yang dimoderasi oleh manusia:
- Gambar digital dari invoice yang diambil dan diunggah oleh pengguna.
- Gambar diverifikasi agar sesuai untuk diproses lebih lanjut – resolusi bagus, semua data terlihat di gambar, tanggal diverifikasi, dll.
- Gambar diperiksa untuk penipuan.
- Teks dalam gambar ini diekstraksi dan dimasukkan ke dalam format yang tepat.
- Data teks dimasukkan ke dalam tabel, spreadsheet, database, neraca, dll.
Fase 3: Pembelajaran Mendalam dan OCR

Pendekatan pembelajaran mendalam telah melihat kemajuan dalam masalah khusus membaca teks dan mengekstraksi informasi terstruktur dan tidak terstruktur dari gambar. Dengan menggabungkan metode pembelajaran mendalam yang ada dengan teknologi pengenalan karakter optik, perusahaan dan individu dapat mengotomatiskan proses digitalisasi dokumen dan memungkinkan prosedur entri data manual yang lebih mudah, pencatatan dan penyimpanan yang lebih baik, kesalahan yang lebih rendah, dan waktu respons yang lebih baik.
Beberapa alat tersedia di pasar dan komunitas sumber terbuka untuk tugas semacam itu, semuanya dengan pro dan kontra. Beberapa di antaranya adalah Google Vision API, Amazon Rekognition, dan Microsoft Cognitive Services. Alat sumber terbuka yang paling umum digunakan adalah Attention-OCR dan Tesseract.
Semua alat ini gagal dengan cara yang sama – akurasi buruk yang memerlukan koreksi kesalahan manual dan kebutuhan mesin berbasis aturan mengikuti ekstraksi teks untuk benar-benar dapat menggunakan data dengan cara apa pun yang berarti. Kami akan berbicara lebih banyak tentang masalah ini dan lebih banyak lagi di bagian mendatang.
Validasi
Data yang diambil dari setiap invoice perlu diverifikasi untuk memastikan jumlah yang benar, tarif PPN, ID PPN, mata uang, detail penjual, dan lainnya. Sebagian besar perusahaan memiliki alur kerja dari berbagai tingkat persetujuan untuk memastikan bahwa kesalahan tidak lolos dari celahnya di mana rekonsiliasi nantinya merupakan proses yang sangat menyakitkan. Perangkat lunak otomasi pemrosesan invoice yang baik memungkinkan Anda untuk menyiapkan beberapa aturan dasar ini dan jika ada nilai yang diekstrak yang melanggarnya, itu akan memunculkan tanda untuk peninjauan manual. Jadi sekarang Anda menambahkan lapisan pemeriksaan yang dipimpin kecerdasan buatan. Dalam proses berulang yang berlebihan ini, mesin dikatakan sebagai tangan manusia.
Penanganan ketidaksesuaian
Jika ada ketidaksesuaian dalam informasi yang diekstraksi dengan aturan bisnis tersebut, seseorang dapat membuat alur kerja penanganan resolusi di mana terdapat verifikasi manual atas data ini. Anda dapat menyetel ambang batas skor kepercayaan untuk menangani otomatisasi semacam itu – jika nilai di bawah angka skor kepercayaan yang telah ditentukan sebelumnya, Anda akan mengarahkannya ke alur kerja manual, jika tidak, dorong ke alur kerja pembayaran otomatis.
Bagaimana Nanonet dapat membantu Anda
Nanonets adalah mesin OCR berbasis kecerdasan buatan yang membantu bisnis di seluruh dunia mengotomatiskan ekstraksi manual. Perangkat lunak Otomasi AP kami membuat pemrosesan faktur bulanan menjadi proses yang tidak merepotkan. Menggunakan invoice OCR API Anda dapat mengurangi hingga 90% tugas manual entri data ke dalam perangkat lunak akuntansi Anda. Kami adalah mitra berharga dari lebih dari 20.000 bisnis di 4 benua.
Nanonets OCR API memungkinkan Anda membuat model OCR dengan mudah. Anda tidak perlu khawatir tentang pra-pemrosesan gambar Anda atau khawatir tentang pencocokan template atau membangun mesin berbasis aturan untuk meningkatkan akurasi model OCR Anda.
Anda dapat mengunggah data, menganotasinya, menyetel model untuk dilatih, dan menunggu untuk mendapatkan prediksi melalui UI berbasis browser tanpa menulis satu baris kode pun, mengkhawatirkan GPU, atau menemukan arsitektur yang tepat untuk model pembelajaran mendalam Anda. Anda juga dapat memperoleh respons JSON dari setiap prediksi untuk mengintegrasikannya dengan sistem Anda sendiri dan membangun aplikasi yang didukung pembelajaran mesin yang dibangun di atas algoritme canggih dan infrastruktur yang kuat.
Menggunakan GUI: https://app.nanonets.com/
Anda juga dapat menggunakan API Nanonets-OCR dengan mengikuti langkah-langkah di bawah ini:
Langkah 1: Kloning Repo, Instal dependensi
git clone https://github.com/NanoNets/nanonets-ocr-sample-python.git
cd nanonets-ocr-sample-python
sudo pip install requests tqdm
Langkah 2: Dapatkan Kunci API gratis Anda
Dapatkan Kunci API gratis Anda dari https://app.nanonets.com/#/keys
Langkah 3: Tetapkan kunci API sebagai Variabel Lingkungan
ekspor NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE
Langkah 4: Buat Model Baru
python ./code/create-model.py
Catatan: Ini menghasilkan MODEL_ID yang Anda perlukan untuk langkah selanjutnya
Langkah 5: Tambahkan ID Model sebagai Variabel Lingkungan
ekspor NANONETS_MODEL_ID=ID_MODEL_ANDA
Catatan: Anda akan mendapatkan YOUR_MODEL_ID dari langkah sebelumnya
Langkah 6: Unggah Data Pelatihan
Data pelatihan ditemukan dalam gambar (file gambar) dan anotasi (penjelasan untuk file gambar)
python ./code/upload-training.py
Langkah 7: Melatih Model
Setelah Gambar diunggah, mulailah melatih Model
python ./code/train-model.py
Langkah 8: Dapatkan Status Model
Model membutuhkan waktu ~2 jam untuk dilatih. Anda akan mendapatkan email setelah model dilatih. Sementara itu, Anda memeriksa status model
python ./code/model-state.py
Langkah 9: Buat Prediksi
Setelah model dilatih. Anda dapat membuat prediksi menggunakan model
python ./code/prediction.py ./images/151.jpg