Cara Membaca File DOC Menggunakan PHP

Pemrogram PHP sering mencari cara untuk memperluas fungsionalitas bahasa ini di luar zona nyamannya. PHP sebagian besar digunakan pada sistem operasi Linux, tetapi pengunjung situs web PHP biasanya bekerja pada sistem Windows atau Macintosh. Situs web yang dirancang untuk mengunggah file Microsoft Word dari pengguna ini mungkin perlu mengekstrak konten file ini dan mengirim email atau memproses teksnya menggunakan algoritme PHP. Tetapi file Microsoft Word, yang diakhiri dengan ekstensi DOC, bukan asli Linux atau PHP. Menjembatani dua lingkungan komputer ini dimungkinkan dengan beberapa persiapan.

Langkah 1

Verifikasi dengan penyedia host Anda bahwa akses PHP tersedia untuk situs web Anda. Sebagian besar server mendukung PHP, tetapi terkadang layanan ini memerlukan peningkatan akun. Anda tidak dapat membaca file DOC menggunakan PHP tanpa akses ke kompiler.

Langkah 2

Unduh utilitas pembaca dokumen MS Word Antiword (lihat Referensi). Program sumber terbuka ini berisi materi pemrograman yang memperluas PHP untuk konversi DOC.

Langkah 3

Buka zip arsip Antiword untuk mengekstrak isinya.

Langkah 4

Unggah seluruh pustaka file Antiword ke server web. Tempatkan file di direktori "bin" dari akun host. Direktori ini adalah repositori umum untuk utilitas dan operasi biner lainnya yang harus sering dieksploitasi oleh pengguna server web.

Langkah 5

Panggil program Antiword dalam skrip PHP apa pun yang dirancang untuk membaca dokumen Microsoft Word DOC. Perintah diimplementasikan menggunakan satu fungsi. Ketik "$content = shell_exec('/usr/local/bin/antiword '.$filename);" di mana "$filename" sama dengan nama file lengkap dari dokumen DOC. Isi file DOC akan dibaca ke dalam variabel "$content". Nama variabel ini, dimulai dengan simbol "$", dapat disesuaikan.

Proses variabel "$content" sesuai keinginan untuk memanipulasi isi file DOC. Setelah DOC dibaca oleh PHP, teks lengkap file tersedia untuk segala bentuk aktivitas lebih lanjut. Konten dapat dikirim melalui email atau disimpan ke database, misalnya.